fix missing earlyclobber flag in i386 a_ctz_64 asm
authorRich Felker <dalias@aerifal.cx>
Wed, 9 Sep 2015 07:18:28 +0000 (07:18 +0000)
committerRich Felker <dalias@aerifal.cx>
Wed, 9 Sep 2015 07:18:28 +0000 (07:18 +0000)
this error was only found by reading the code, but it seems to have
been causing gcc to produce wrong code in malloc: the same register
was used for the output and the high word of the input. in principle
this could have caused an infinite loop searching for an available
bin, but in practice most x86 models seem to implement the "undefined"
result of the bsf instruction as "unchanged".

arch/i386/atomic.h

index 25441df234410e6120bff1d60c533e353f53149f..fd222eae008c9e3c24a9b38f17be112c27d7332d 100644 (file)
@@ -7,7 +7,7 @@ static inline int a_ctz_64(uint64_t x)
 {
        int r;
        __asm__( "bsf %1,%0 ; jnz 1f ; bsf %2,%0 ; addl $32,%0\n1:"
-               : "=r"(r) : "r"((unsigned)x), "r"((unsigned)(x>>32)) );
+               : "=&r"(r) : "r"((unsigned)x), "r"((unsigned)(x>>32)) );
        return r;
 }