optimize two-way strstr and memmem bad character shift
authorRich Felker <dalias@aerifal.cx>
Thu, 8 Nov 2018 20:00:02 +0000 (15:00 -0500)
committerRich Felker <dalias@aerifal.cx>
Thu, 8 Nov 2018 20:22:22 +0000 (15:22 -0500)
first, the condition (mem && k < p) is redundant, because mem being
nonzero implies the needle is periodic with period exactly p, in which
case any byte that appears in the needle must appear in the last p
bytes of the needle, bounding the shift (k) by p.

second, the whole point of replacing the shift k by mem (=l-p) is to
prevent shifting by less than mem when discarding the memory on shift,
in which case linear time could not be guaranteed. but as written, the
check also replaced shifts greater than mem by mem, reducing the
benefit of the shift. there is no possible benefit to this reduction of
the shift; since mem is being cleared, the full shift is valid and
more optimal. so only replace the shift by mem when it would be less
than mem.

src/string/memmem.c
src/string/strstr.c

index ce3cd190afae6efd84cf4707dbbd181929daab50..58a21fcd6e8dd36ee0370ad907da635397e912a6 100644 (file)
@@ -100,7 +100,7 @@ static char *twoway_memmem(const unsigned char *h, const unsigned char *z, const
                if (BITOP(byteset, h[l-1], &)) {
                        k = l-shift[h[l-1]];
                        if (k) {
-                               if (mem && k < p) k = l-p;
+                               if (k < mem) k = mem;
                                h += k;
                                mem = 0;
                                continue;
index c7d6668265dc03610451f2f47e991dc155d81148..55ba1c7b45a0ef0b7087754684055aa0e84d27ce 100644 (file)
@@ -109,7 +109,7 @@ static char *twoway_strstr(const unsigned char *h, const unsigned char *n)
                if (BITOP(byteset, h[l-1], &)) {
                        k = l-shift[h[l-1]];
                        if (k) {
-                               if (mem && k < p) k = l-p;
+                               if (k < mem) k = mem;
                                h += k;
                                mem = 0;
                                continue;