Branch data Line data Source code
1 : : /* stringlib: fastsearch implementation */
2 : :
3 : : #define STRINGLIB_FASTSEARCH_H
4 : :
5 : : /* fast search/count implementation, based on a mix between boyer-
6 : : moore and horspool, with a few more bells and whistles on the top.
7 : : for some more background, see:
8 : : https://web.archive.org/web/20201107074620/http://effbot.org/zone/stringlib.htm */
9 : :
10 : : /* note: fastsearch may access s[n], which isn't a problem when using
11 : : Python's ordinary string types, but may cause problems if you're
12 : : using this code in other contexts. also, the count mode returns -1
13 : : if there cannot possibly be a match in the target string, and 0 if
14 : : it has actually checked for matches, but didn't find any. callers
15 : : beware! */
16 : :
17 : : /* If the strings are long enough, use Crochemore and Perrin's Two-Way
18 : : algorithm, which has worst-case O(n) runtime and best-case O(n/k).
19 : : Also compute a table of shifts to achieve O(n/k) in more cases,
20 : : and often (data dependent) deduce larger shifts than pure C&P can
21 : : deduce. */
22 : :
23 : : #define FAST_COUNT 0
24 : : #define FAST_SEARCH 1
25 : : #define FAST_RSEARCH 2
26 : :
27 : : #if LONG_BIT >= 128
28 : : #define STRINGLIB_BLOOM_WIDTH 128
29 : : #elif LONG_BIT >= 64
30 : : #define STRINGLIB_BLOOM_WIDTH 64
31 : : #elif LONG_BIT >= 32
32 : : #define STRINGLIB_BLOOM_WIDTH 32
33 : : #else
34 : : #error "LONG_BIT is smaller than 32"
35 : : #endif
36 : :
37 : : #define STRINGLIB_BLOOM_ADD(mask, ch) \
38 : : ((mask |= (1UL << ((ch) & (STRINGLIB_BLOOM_WIDTH -1)))))
39 : : #define STRINGLIB_BLOOM(mask, ch) \
40 : : ((mask & (1UL << ((ch) & (STRINGLIB_BLOOM_WIDTH -1)))))
41 : :
42 : : #ifdef STRINGLIB_FAST_MEMCHR
43 : : # define MEMCHR_CUT_OFF 15
44 : : #else
45 : : # define MEMCHR_CUT_OFF 40
46 : : #endif
47 : :
48 : : Py_LOCAL_INLINE(Py_ssize_t)
49 : 35180622 : STRINGLIB(find_char)(const STRINGLIB_CHAR* s, Py_ssize_t n, STRINGLIB_CHAR ch)
50 : : {
51 : : const STRINGLIB_CHAR *p, *e;
52 : :
53 : 35180622 : p = s;
54 : 35180622 : e = s + n;
55 [ + + ]: 35180622 : if (n > MEMCHR_CUT_OFF) {
56 : : #ifdef STRINGLIB_FAST_MEMCHR
57 : 1957828 : p = STRINGLIB_FAST_MEMCHR(s, ch, n);
58 [ + + ]: 1957828 : if (p != NULL)
59 : 1180776 : return (p - s);
60 : 777052 : return -1;
61 : : #else
62 : : /* use memchr if we can choose a needle without too many likely
63 : : false positives */
64 : : const STRINGLIB_CHAR *s1, *e1;
65 : 16811 : unsigned char needle = ch & 0xff;
66 : : /* If looking for a multiple of 256, we'd have too
67 : : many false positives looking for the '\0' byte in UCS2
68 : : and UCS4 representations. */
69 [ + + ]: 16811 : if (needle != 0) {
70 : : do {
71 : 16803 : void *candidate = memchr(p, needle,
72 : 16803 : (e - p) * sizeof(STRINGLIB_CHAR));
73 [ + + ]: 16803 : if (candidate == NULL)
74 : 22 : return -1;
75 : 16781 : s1 = p;
76 : 16781 : p = (const STRINGLIB_CHAR *)
77 : 16781 : _Py_ALIGN_DOWN(candidate, sizeof(STRINGLIB_CHAR));
78 [ + + ]: 16781 : if (*p == ch)
79 : 16777 : return (p - s);
80 : : /* False positive */
81 : 4 : p++;
82 [ + + ]: 4 : if (p - s1 > MEMCHR_CUT_OFF)
83 : 2 : continue;
84 [ - + ]: 2 : if (e - p <= MEMCHR_CUT_OFF)
85 : 0 : break;
86 : 2 : e1 = p + MEMCHR_CUT_OFF;
87 [ + - ]: 6 : while (p != e1) {
88 [ + + ]: 6 : if (*p == ch)
89 : 2 : return (p - s);
90 : 4 : p++;
91 : : }
92 : : }
93 [ + + ]: 2 : while (e - p > MEMCHR_CUT_OFF);
94 : : }
95 : : #endif
96 : : }
97 [ + + ]: 169982155 : while (p < e) {
98 [ + + ]: 142009152 : if (*p == ch)
99 : 5232990 : return (p - s);
100 : 136776162 : p++;
101 : : }
102 : 27973003 : return -1;
103 : : }
104 : :
105 : : #undef MEMCHR_CUT_OFF
106 : :
107 : : #if STRINGLIB_SIZEOF_CHAR == 1
108 : : # define MEMRCHR_CUT_OFF 15
109 : : #else
110 : : # define MEMRCHR_CUT_OFF 40
111 : : #endif
112 : :
113 : :
114 : : Py_LOCAL_INLINE(Py_ssize_t)
115 : 2779643 : STRINGLIB(rfind_char)(const STRINGLIB_CHAR* s, Py_ssize_t n, STRINGLIB_CHAR ch)
116 : : {
117 : : const STRINGLIB_CHAR *p;
118 : : #ifdef HAVE_MEMRCHR
119 : : /* memrchr() is a GNU extension, available since glibc 2.1.91. it
120 : : doesn't seem as optimized as memchr(), but is still quite
121 : : faster than our hand-written loop below. There is no wmemrchr
122 : : for 4-byte chars. */
123 : :
124 [ + + ]: 2779643 : if (n > MEMRCHR_CUT_OFF) {
125 : : #if STRINGLIB_SIZEOF_CHAR == 1
126 : 1108511 : p = memrchr(s, ch, n);
127 [ + + ]: 1108511 : if (p != NULL)
128 : 1061472 : return (p - s);
129 : 47039 : return -1;
130 : : #else
131 : : /* use memrchr if we can choose a needle without too many likely
132 : : false positives */
133 : : const STRINGLIB_CHAR *s1;
134 : : Py_ssize_t n1;
135 : 68 : unsigned char needle = ch & 0xff;
136 : : /* If looking for a multiple of 256, we'd have too
137 : : many false positives looking for the '\0' byte in UCS2
138 : : and UCS4 representations. */
139 [ + + ]: 68 : if (needle != 0) {
140 : : do {
141 : 64 : void *candidate = memrchr(s, needle,
142 : : n * sizeof(STRINGLIB_CHAR));
143 [ + + ]: 64 : if (candidate == NULL)
144 : 2 : return -1;
145 : 62 : n1 = n;
146 : 62 : p = (const STRINGLIB_CHAR *)
147 : 62 : _Py_ALIGN_DOWN(candidate, sizeof(STRINGLIB_CHAR));
148 : 62 : n = p - s;
149 [ + + ]: 62 : if (*p == ch)
150 : 59 : return n;
151 : : /* False positive */
152 [ + - ]: 3 : if (n1 - n > MEMRCHR_CUT_OFF)
153 : 3 : continue;
154 [ # # ]: 0 : if (n <= MEMRCHR_CUT_OFF)
155 : 0 : break;
156 : 0 : s1 = p - MEMRCHR_CUT_OFF;
157 [ # # ]: 0 : while (p > s1) {
158 : 0 : p--;
159 [ # # ]: 0 : if (*p == ch)
160 : 0 : return (p - s);
161 : : }
162 : 0 : n = p - s;
163 : : }
164 [ - + ]: 3 : while (n > MEMRCHR_CUT_OFF);
165 : : }
166 : : #endif
167 : : }
168 : : #endif /* HAVE_MEMRCHR */
169 : 1671071 : p = s + n;
170 [ + + ]: 10518780 : while (p > s) {
171 : 9560786 : p--;
172 [ + + ]: 9560786 : if (*p == ch)
173 : 713077 : return (p - s);
174 : : }
175 : 957994 : return -1;
176 : : }
177 : :
178 : : #undef MEMRCHR_CUT_OFF
179 : :
180 : : /* Change to a 1 to see logging comments walk through the algorithm. */
181 : : #if 0 && STRINGLIB_SIZEOF_CHAR == 1
182 : : # define LOG(...) printf(__VA_ARGS__)
183 : : # define LOG_STRING(s, n) printf("\"%.*s\"", (int)(n), s)
184 : : # define LOG_LINEUP() do { \
185 : : LOG("> "); LOG_STRING(haystack, len_haystack); LOG("\n> "); \
186 : : LOG("%*s",(int)(window_last - haystack + 1 - len_needle), ""); \
187 : : LOG_STRING(needle, len_needle); LOG("\n"); \
188 : : } while(0)
189 : : #else
190 : : # define LOG(...)
191 : : # define LOG_STRING(s, n)
192 : : # define LOG_LINEUP()
193 : : #endif
194 : :
195 : : Py_LOCAL_INLINE(Py_ssize_t)
196 : 1224 : STRINGLIB(_lex_search)(const STRINGLIB_CHAR *needle, Py_ssize_t len_needle,
197 : : Py_ssize_t *return_period, int invert_alphabet)
198 : : {
199 : : /* Do a lexicographic search. Essentially this:
200 : : >>> max(needle[i:] for i in range(len(needle)+1))
201 : : Also find the period of the right half. */
202 : 1224 : Py_ssize_t max_suffix = 0;
203 : 1224 : Py_ssize_t candidate = 1;
204 : 1224 : Py_ssize_t k = 0;
205 : : // The period of the right half.
206 : 1224 : Py_ssize_t period = 1;
207 : :
208 [ + + ]: 111312 : while (candidate + k < len_needle) {
209 : : // each loop increases candidate + k + max_suffix
210 : 110088 : STRINGLIB_CHAR a = needle[candidate + k];
211 : 110088 : STRINGLIB_CHAR b = needle[max_suffix + k];
212 : : // check if the suffix at candidate is better than max_suffix
213 [ + + + + ]: 110088 : if (invert_alphabet ? (b < a) : (a < b)) {
214 : : // Fell short of max_suffix.
215 : : // The next k + 1 characters are non-increasing
216 : : // from candidate, so they won't start a maximal suffix.
217 : 31728 : candidate += k + 1;
218 : 31728 : k = 0;
219 : : // We've ruled out any period smaller than what's
220 : : // been scanned since max_suffix.
221 : 31728 : period = candidate - max_suffix;
222 : : }
223 [ + + ]: 78360 : else if (a == b) {
224 [ + + ]: 76744 : if (k + 1 != period) {
225 : : // Keep scanning the equal strings
226 : 63148 : k++;
227 : : }
228 : : else {
229 : : // Matched a whole period.
230 : : // Start matching the next period.
231 : 13596 : candidate += period;
232 : 13596 : k = 0;
233 : : }
234 : : }
235 : : else {
236 : : // Did better than max_suffix, so replace it.
237 : 1616 : max_suffix = candidate;
238 : 1616 : candidate++;
239 : 1616 : k = 0;
240 : 1616 : period = 1;
241 : : }
242 : : }
243 : 1224 : *return_period = period;
244 : 1224 : return max_suffix;
245 : : }
246 : :
247 : : Py_LOCAL_INLINE(Py_ssize_t)
248 : 612 : STRINGLIB(_factorize)(const STRINGLIB_CHAR *needle,
249 : : Py_ssize_t len_needle,
250 : : Py_ssize_t *return_period)
251 : : {
252 : : /* Do a "critical factorization", making it so that:
253 : : >>> needle = (left := needle[:cut]) + (right := needle[cut:])
254 : : where the "local period" of the cut is maximal.
255 : :
256 : : The local period of the cut is the minimal length of a string w
257 : : such that (left endswith w or w endswith left)
258 : : and (right startswith w or w startswith left).
259 : :
260 : : The Critical Factorization Theorem says that this maximal local
261 : : period is the global period of the string.
262 : :
263 : : Crochemore and Perrin (1991) show that this cut can be computed
264 : : as the later of two cuts: one that gives a lexicographically
265 : : maximal right half, and one that gives the same with the
266 : : with respect to a reversed alphabet-ordering.
267 : :
268 : : This is what we want to happen:
269 : : >>> x = "GCAGAGAG"
270 : : >>> cut, period = factorize(x)
271 : : >>> x[:cut], (right := x[cut:])
272 : : ('GC', 'AGAGAG')
273 : : >>> period # right half period
274 : : 2
275 : : >>> right[period:] == right[:-period]
276 : : True
277 : :
278 : : This is how the local period lines up in the above example:
279 : : GC | AGAGAG
280 : : AGAGAGC = AGAGAGC
281 : : The length of this minimal repetition is 7, which is indeed the
282 : : period of the original string. */
283 : :
284 : : Py_ssize_t cut1, period1, cut2, period2, cut, period;
285 : 612 : cut1 = STRINGLIB(_lex_search)(needle, len_needle, &period1, 0);
286 : 612 : cut2 = STRINGLIB(_lex_search)(needle, len_needle, &period2, 1);
287 : :
288 : : // Take the later cut.
289 [ + + ]: 612 : if (cut1 > cut2) {
290 : 464 : period = period1;
291 : 464 : cut = cut1;
292 : : }
293 : : else {
294 : 148 : period = period2;
295 : 148 : cut = cut2;
296 : : }
297 : :
298 : : LOG("split: "); LOG_STRING(needle, cut);
299 : : LOG(" + "); LOG_STRING(needle + cut, len_needle - cut);
300 : : LOG("\n");
301 : :
302 : 612 : *return_period = period;
303 : 612 : return cut;
304 : : }
305 : :
306 : :
307 : : #define SHIFT_TYPE uint8_t
308 : : #define MAX_SHIFT UINT8_MAX
309 : :
310 : : #define TABLE_SIZE_BITS 6u
311 : : #define TABLE_SIZE (1U << TABLE_SIZE_BITS)
312 : : #define TABLE_MASK (TABLE_SIZE - 1U)
313 : :
314 : : typedef struct STRINGLIB(_pre) {
315 : : const STRINGLIB_CHAR *needle;
316 : : Py_ssize_t len_needle;
317 : : Py_ssize_t cut;
318 : : Py_ssize_t period;
319 : : Py_ssize_t gap;
320 : : int is_periodic;
321 : : SHIFT_TYPE table[TABLE_SIZE];
322 : : } STRINGLIB(prework);
323 : :
324 : :
325 : : static void
326 : 612 : STRINGLIB(_preprocess)(const STRINGLIB_CHAR *needle, Py_ssize_t len_needle,
327 : : STRINGLIB(prework) *p)
328 : : {
329 : 612 : p->needle = needle;
330 : 612 : p->len_needle = len_needle;
331 : 612 : p->cut = STRINGLIB(_factorize)(needle, len_needle, &(p->period));
332 : : assert(p->period + p->cut <= len_needle);
333 : 612 : p->is_periodic = (0 == memcmp(needle,
334 : 612 : needle + p->period,
335 : 612 : p->cut * STRINGLIB_SIZEOF_CHAR));
336 [ + + ]: 612 : if (p->is_periodic) {
337 : : assert(p->cut <= len_needle/2);
338 : : assert(p->cut < p->period);
339 : 266 : p->gap = 0; // unused
340 : : }
341 : : else {
342 : : // A lower bound on the period
343 : 346 : p->period = Py_MAX(p->cut, len_needle - p->cut) + 1;
344 : : // The gap between the last character and the previous
345 : : // occurrence of an equivalent character (modulo TABLE_SIZE)
346 : 346 : p->gap = len_needle;
347 : 346 : STRINGLIB_CHAR last = needle[len_needle - 1] & TABLE_MASK;
348 [ + + ]: 9745 : for (Py_ssize_t i = len_needle - 2; i >= 0; i--) {
349 : 9732 : STRINGLIB_CHAR x = needle[i] & TABLE_MASK;
350 [ + + ]: 9732 : if (x == last) {
351 : 333 : p->gap = len_needle - 1 - i;
352 : 333 : break;
353 : : }
354 : : }
355 : : }
356 : : // Fill up a compressed Boyer-Moore "Bad Character" table
357 : 612 : Py_ssize_t not_found_shift = Py_MIN(len_needle, MAX_SHIFT);
358 [ + + ]: 39780 : for (Py_ssize_t i = 0; i < (Py_ssize_t)TABLE_SIZE; i++) {
359 : 39168 : p->table[i] = Py_SAFE_DOWNCAST(not_found_shift,
360 : : Py_ssize_t, SHIFT_TYPE);
361 : : }
362 [ + + ]: 40637 : for (Py_ssize_t i = len_needle - not_found_shift; i < len_needle; i++) {
363 : 40025 : SHIFT_TYPE shift = Py_SAFE_DOWNCAST(len_needle - 1 - i,
364 : : Py_ssize_t, SHIFT_TYPE);
365 : 40025 : p->table[needle[i] & TABLE_MASK] = shift;
366 : : }
367 : 612 : }
368 : :
369 : : static Py_ssize_t
370 : 668 : STRINGLIB(_two_way)(const STRINGLIB_CHAR *haystack, Py_ssize_t len_haystack,
371 : : STRINGLIB(prework) *p)
372 : : {
373 : : // Crochemore and Perrin's (1991) Two-Way algorithm.
374 : : // See http://www-igm.univ-mlv.fr/~lecroq/string/node26.html#SECTION00260
375 : 668 : const Py_ssize_t len_needle = p->len_needle;
376 : 668 : const Py_ssize_t cut = p->cut;
377 : 668 : Py_ssize_t period = p->period;
378 : 668 : const STRINGLIB_CHAR *const needle = p->needle;
379 : 668 : const STRINGLIB_CHAR *window_last = haystack + len_needle - 1;
380 : 668 : const STRINGLIB_CHAR *const haystack_end = haystack + len_haystack;
381 : 668 : SHIFT_TYPE *table = p->table;
382 : : const STRINGLIB_CHAR *window;
383 : : LOG("===== Two-way: \"%s\" in \"%s\". =====\n", needle, haystack);
384 : :
385 [ + + ]: 668 : if (p->is_periodic) {
386 : : LOG("Needle is periodic.\n");
387 : 281 : Py_ssize_t memory = 0;
388 : 6803 : periodicwindowloop:
389 [ + - ]: 7084 : while (window_last < haystack_end) {
390 : : assert(memory == 0);
391 : 26888 : for (;;) {
392 : : LOG_LINEUP();
393 : 33972 : Py_ssize_t shift = table[(*window_last) & TABLE_MASK];
394 : 33972 : window_last += shift;
395 [ + + ]: 33972 : if (shift == 0) {
396 : 7083 : break;
397 : : }
398 [ + + ]: 26889 : if (window_last >= haystack_end) {
399 : 1 : return -1;
400 : : }
401 : : LOG("Horspool skip");
402 : : }
403 : 7098 : no_shift:
404 : 7098 : window = window_last - len_needle + 1;
405 : : assert((window[len_needle - 1] & TABLE_MASK) ==
406 : : (needle[len_needle - 1] & TABLE_MASK));
407 : 7098 : Py_ssize_t i = Py_MAX(cut, memory);
408 [ + + ]: 41488 : for (; i < len_needle; i++) {
409 [ + + ]: 41193 : if (needle[i] != window[i]) {
410 : : LOG("Right half does not match.\n");
411 : 6803 : window_last += i - cut + 1;
412 : 6803 : memory = 0;
413 : 6803 : goto periodicwindowloop;
414 : : }
415 : : }
416 [ + + ]: 3057 : for (i = memory; i < cut; i++) {
417 [ + + ]: 2777 : if (needle[i] != window[i]) {
418 : : LOG("Left half does not match.\n");
419 : 15 : window_last += period;
420 : 15 : memory = len_needle - period;
421 [ - + ]: 15 : if (window_last >= haystack_end) {
422 : 0 : return -1;
423 : : }
424 : 15 : Py_ssize_t shift = table[(*window_last) & TABLE_MASK];
425 [ - + ]: 15 : if (shift) {
426 : : // A mismatch has been identified to the right
427 : : // of where i will next start, so we can jump
428 : : // at least as far as if the mismatch occurred
429 : : // on the first comparison.
430 : 0 : Py_ssize_t mem_jump = Py_MAX(cut, memory) - cut + 1;
431 : : LOG("Skip with Memory.\n");
432 : 0 : memory = 0;
433 [ # # ]: 0 : window_last += Py_MAX(shift, mem_jump);
434 : 0 : goto periodicwindowloop;
435 : : }
436 : 15 : goto no_shift;
437 : : }
438 : : }
439 : : LOG("Found a match!\n");
440 : 280 : return window - haystack;
441 : : }
442 : : }
443 : : else {
444 : 387 : Py_ssize_t gap = p->gap;
445 : 387 : period = Py_MAX(gap, period);
446 : : LOG("Needle is not periodic.\n");
447 : 387 : Py_ssize_t gap_jump_end = Py_MIN(len_needle, cut + gap);
448 : 36836 : windowloop:
449 [ + - ]: 37223 : while (window_last < haystack_end) {
450 : 2130308 : for (;;) {
451 : : LOG_LINEUP();
452 : 2167531 : Py_ssize_t shift = table[(*window_last) & TABLE_MASK];
453 : 2167531 : window_last += shift;
454 [ + + ]: 2167531 : if (shift == 0) {
455 : 37043 : break;
456 : : }
457 [ + + ]: 2130488 : if (window_last >= haystack_end) {
458 : 180 : return -1;
459 : : }
460 : : LOG("Horspool skip");
461 : : }
462 : 37043 : window = window_last - len_needle + 1;
463 : : assert((window[len_needle - 1] & TABLE_MASK) ==
464 : : (needle[len_needle - 1] & TABLE_MASK));
465 [ + + ]: 49688 : for (Py_ssize_t i = cut; i < gap_jump_end; i++) {
466 [ + + ]: 47221 : if (needle[i] != window[i]) {
467 : : LOG("Early right half mismatch: jump by gap.\n");
468 : : assert(gap >= i - cut + 1);
469 : 34576 : window_last += gap;
470 : 34576 : goto windowloop;
471 : : }
472 : : }
473 [ + + ]: 6178 : for (Py_ssize_t i = gap_jump_end; i < len_needle; i++) {
474 [ + + ]: 5810 : if (needle[i] != window[i]) {
475 : : LOG("Late right half mismatch.\n");
476 : : assert(i - cut + 1 > gap);
477 : 2099 : window_last += i - cut + 1;
478 : 2099 : goto windowloop;
479 : : }
480 : : }
481 [ + + ]: 11468 : for (Py_ssize_t i = 0; i < cut; i++) {
482 [ + + ]: 11261 : if (needle[i] != window[i]) {
483 : : LOG("Left half does not match.\n");
484 : 161 : window_last += period;
485 : 161 : goto windowloop;
486 : : }
487 : : }
488 : : LOG("Found a match!\n");
489 : 207 : return window - haystack;
490 : : }
491 : : }
492 : : LOG("Not found. Returning -1.\n");
493 : 0 : return -1;
494 : : }
495 : :
496 : :
497 : : static Py_ssize_t
498 : 609 : STRINGLIB(_two_way_find)(const STRINGLIB_CHAR *haystack,
499 : : Py_ssize_t len_haystack,
500 : : const STRINGLIB_CHAR *needle,
501 : : Py_ssize_t len_needle)
502 : : {
503 : : LOG("###### Finding \"%s\" in \"%s\".\n", needle, haystack);
504 : : STRINGLIB(prework) p;
505 : 609 : STRINGLIB(_preprocess)(needle, len_needle, &p);
506 : 609 : return STRINGLIB(_two_way)(haystack, len_haystack, &p);
507 : : }
508 : :
509 : :
510 : : static Py_ssize_t
511 : 3 : STRINGLIB(_two_way_count)(const STRINGLIB_CHAR *haystack,
512 : : Py_ssize_t len_haystack,
513 : : const STRINGLIB_CHAR *needle,
514 : : Py_ssize_t len_needle,
515 : : Py_ssize_t maxcount)
516 : : {
517 : : LOG("###### Counting \"%s\" in \"%s\".\n", needle, haystack);
518 : : STRINGLIB(prework) p;
519 : 3 : STRINGLIB(_preprocess)(needle, len_needle, &p);
520 : 3 : Py_ssize_t index = 0, count = 0;
521 : 56 : while (1) {
522 : : Py_ssize_t result;
523 : 59 : result = STRINGLIB(_two_way)(haystack + index,
524 : : len_haystack - index, &p);
525 [ + + ]: 59 : if (result == -1) {
526 : 3 : return count;
527 : : }
528 : 56 : count++;
529 [ - + ]: 56 : if (count == maxcount) {
530 : 0 : return maxcount;
531 : : }
532 : 56 : index += result + len_needle;
533 : : }
534 : : return count;
535 : : }
536 : :
537 : : #undef SHIFT_TYPE
538 : : #undef NOT_FOUND
539 : : #undef SHIFT_OVERFLOW
540 : : #undef TABLE_SIZE_BITS
541 : : #undef TABLE_SIZE
542 : : #undef TABLE_MASK
543 : :
544 : : #undef LOG
545 : : #undef LOG_STRING
546 : : #undef LOG_LINEUP
547 : :
548 : : static inline Py_ssize_t
549 : 4911534 : STRINGLIB(default_find)(const STRINGLIB_CHAR* s, Py_ssize_t n,
550 : : const STRINGLIB_CHAR* p, Py_ssize_t m,
551 : : Py_ssize_t maxcount, int mode)
552 : : {
553 : 4911534 : const Py_ssize_t w = n - m;
554 : 4911534 : Py_ssize_t mlast = m - 1, count = 0;
555 : 4911534 : Py_ssize_t gap = mlast;
556 : 4911534 : const STRINGLIB_CHAR last = p[mlast];
557 : 4911534 : const STRINGLIB_CHAR *const ss = &s[mlast];
558 : :
559 : 4911534 : unsigned long mask = 0;
560 [ + + ]: 18290641 : for (Py_ssize_t i = 0; i < mlast; i++) {
561 : 13379107 : STRINGLIB_BLOOM_ADD(mask, p[i]);
562 [ + + ]: 13379107 : if (p[i] == last) {
563 : 3491402 : gap = mlast - i - 1;
564 : : }
565 : : }
566 : 4911534 : STRINGLIB_BLOOM_ADD(mask, last);
567 : :
568 [ + + ]: 50538156 : for (Py_ssize_t i = 0; i <= w; i++) {
569 [ + + ]: 46338612 : if (ss[i] == last) {
570 : : /* candidate match */
571 : : Py_ssize_t j;
572 [ + + ]: 5447088 : for (j = 0; j < mlast; j++) {
573 [ + + ]: 4672184 : if (s[i+j] != p[j]) {
574 : 2429000 : break;
575 : : }
576 : : }
577 [ + + ]: 3203904 : if (j == mlast) {
578 : : /* got a match! */
579 [ + + ]: 774904 : if (mode != FAST_COUNT) {
580 : 711966 : return i;
581 : : }
582 : 62938 : count++;
583 [ + + ]: 62938 : if (count == maxcount) {
584 : 24 : return maxcount;
585 : : }
586 : 62914 : i = i + mlast;
587 : 62914 : continue;
588 : : }
589 : : /* miss: check if next character is part of pattern */
590 [ + + ]: 2429000 : if (!STRINGLIB_BLOOM(mask, ss[i+1])) {
591 : 1732492 : i = i + m;
592 : : }
593 : : else {
594 : 696508 : i = i + gap;
595 : : }
596 : : }
597 : : else {
598 : : /* skip: check if next character is part of pattern */
599 [ + + ]: 43134708 : if (!STRINGLIB_BLOOM(mask, ss[i+1])) {
600 : 39877546 : i = i + m;
601 : : }
602 : : }
603 : : }
604 [ + + ]: 4199544 : return mode == FAST_COUNT ? count : -1;
605 : : }
606 : :
607 : :
608 : : static Py_ssize_t
609 : 0 : STRINGLIB(adaptive_find)(const STRINGLIB_CHAR* s, Py_ssize_t n,
610 : : const STRINGLIB_CHAR* p, Py_ssize_t m,
611 : : Py_ssize_t maxcount, int mode)
612 : : {
613 : 0 : const Py_ssize_t w = n - m;
614 : 0 : Py_ssize_t mlast = m - 1, count = 0;
615 : 0 : Py_ssize_t gap = mlast;
616 : 0 : Py_ssize_t hits = 0, res;
617 : 0 : const STRINGLIB_CHAR last = p[mlast];
618 : 0 : const STRINGLIB_CHAR *const ss = &s[mlast];
619 : :
620 : 0 : unsigned long mask = 0;
621 [ # # ]: 0 : for (Py_ssize_t i = 0; i < mlast; i++) {
622 : 0 : STRINGLIB_BLOOM_ADD(mask, p[i]);
623 [ # # ]: 0 : if (p[i] == last) {
624 : 0 : gap = mlast - i - 1;
625 : : }
626 : : }
627 : 0 : STRINGLIB_BLOOM_ADD(mask, last);
628 : :
629 [ # # ]: 0 : for (Py_ssize_t i = 0; i <= w; i++) {
630 [ # # ]: 0 : if (ss[i] == last) {
631 : : /* candidate match */
632 : : Py_ssize_t j;
633 [ # # ]: 0 : for (j = 0; j < mlast; j++) {
634 [ # # ]: 0 : if (s[i+j] != p[j]) {
635 : 0 : break;
636 : : }
637 : : }
638 [ # # ]: 0 : if (j == mlast) {
639 : : /* got a match! */
640 [ # # ]: 0 : if (mode != FAST_COUNT) {
641 : 0 : return i;
642 : : }
643 : 0 : count++;
644 [ # # ]: 0 : if (count == maxcount) {
645 : 0 : return maxcount;
646 : : }
647 : 0 : i = i + mlast;
648 : 0 : continue;
649 : : }
650 : 0 : hits += j + 1;
651 [ # # # # ]: 0 : if (hits > m / 4 && w - i > 2000) {
652 [ # # ]: 0 : if (mode == FAST_SEARCH) {
653 : 0 : res = STRINGLIB(_two_way_find)(s + i, n - i, p, m);
654 [ # # ]: 0 : return res == -1 ? -1 : res + i;
655 : : }
656 : : else {
657 : 0 : res = STRINGLIB(_two_way_count)(s + i, n - i, p, m,
658 : : maxcount - count);
659 : 0 : return res + count;
660 : : }
661 : : }
662 : : /* miss: check if next character is part of pattern */
663 [ # # ]: 0 : if (!STRINGLIB_BLOOM(mask, ss[i+1])) {
664 : 0 : i = i + m;
665 : : }
666 : : else {
667 : 0 : i = i + gap;
668 : : }
669 : : }
670 : : else {
671 : : /* skip: check if next character is part of pattern */
672 [ # # ]: 0 : if (!STRINGLIB_BLOOM(mask, ss[i+1])) {
673 : 0 : i = i + m;
674 : : }
675 : : }
676 : : }
677 [ # # ]: 0 : return mode == FAST_COUNT ? count : -1;
678 : : }
679 : :
680 : :
681 : : static Py_ssize_t
682 : 393083 : STRINGLIB(default_rfind)(const STRINGLIB_CHAR* s, Py_ssize_t n,
683 : : const STRINGLIB_CHAR* p, Py_ssize_t m,
684 : : Py_ssize_t maxcount, int mode)
685 : : {
686 : : /* create compressed boyer-moore delta 1 table */
687 : 393083 : unsigned long mask = 0;
688 : 393083 : Py_ssize_t i, j, mlast = m - 1, skip = m - 1, w = n - m;
689 : :
690 : : /* process pattern[0] outside the loop */
691 : 393083 : STRINGLIB_BLOOM_ADD(mask, p[0]);
692 : : /* process pattern[:0:-1] */
693 [ + + ]: 1744518 : for (i = mlast; i > 0; i--) {
694 : 1351435 : STRINGLIB_BLOOM_ADD(mask, p[i]);
695 [ + + ]: 1351435 : if (p[i] == p[0]) {
696 : 449740 : skip = i - 1;
697 : : }
698 : : }
699 : :
700 [ + + ]: 1397457 : for (i = w; i >= 0; i--) {
701 [ + + ]: 1016109 : if (s[i] == p[0]) {
702 : : /* candidate match */
703 [ + + ]: 255553 : for (j = mlast; j > 0; j--) {
704 [ + + ]: 243818 : if (s[i+j] != p[j]) {
705 : 159957 : break;
706 : : }
707 : : }
708 [ + + ]: 171692 : if (j == 0) {
709 : : /* got a match! */
710 : 11735 : return i;
711 : : }
712 : : /* miss: check if previous character is part of pattern */
713 [ + + + + ]: 159957 : if (i > 0 && !STRINGLIB_BLOOM(mask, s[i-1])) {
714 : 13443 : i = i - m;
715 : : }
716 : : else {
717 : 146514 : i = i - skip;
718 : : }
719 : : }
720 : : else {
721 : : /* skip: check if previous character is part of pattern */
722 [ + + + + ]: 844417 : if (i > 0 && !STRINGLIB_BLOOM(mask, s[i-1])) {
723 : 554860 : i = i - m;
724 : : }
725 : : }
726 : : }
727 : 381348 : return -1;
728 : : }
729 : :
730 : :
731 : : static inline Py_ssize_t
732 : 1601241 : STRINGLIB(count_char)(const STRINGLIB_CHAR *s, Py_ssize_t n,
733 : : const STRINGLIB_CHAR p0, Py_ssize_t maxcount)
734 : : {
735 : 1601241 : Py_ssize_t i, count = 0;
736 [ + + ]: 559304729 : for (i = 0; i < n; i++) {
737 [ + + ]: 557703508 : if (s[i] == p0) {
738 : 7997151 : count++;
739 [ + + ]: 7997151 : if (count == maxcount) {
740 : 20 : return maxcount;
741 : : }
742 : : }
743 : : }
744 : 1601221 : return count;
745 : : }
746 : :
747 : :
748 : : Py_LOCAL_INLINE(Py_ssize_t)
749 : 9589917 : FASTSEARCH(const STRINGLIB_CHAR* s, Py_ssize_t n,
750 : : const STRINGLIB_CHAR* p, Py_ssize_t m,
751 : : Py_ssize_t maxcount, int mode)
752 : : {
753 [ + + + + : 9589917 : if (n < m || (mode == FAST_COUNT && maxcount == 0)) {
- + ]
754 : 181565 : return -1;
755 : : }
756 : :
757 : : /* look for special cases */
758 [ + + ]: 9408352 : if (m <= 1) {
759 [ - + ]: 4103123 : if (m <= 0) {
760 : 0 : return -1;
761 : : }
762 : : /* use special case for 1-character strings */
763 [ + + ]: 4103123 : if (mode == FAST_SEARCH)
764 : 893018 : return STRINGLIB(find_char)(s, n, p[0]);
765 [ + + ]: 3210105 : else if (mode == FAST_RSEARCH)
766 : 1608864 : return STRINGLIB(rfind_char)(s, n, p[0]);
767 : : else {
768 : 1601241 : return STRINGLIB(count_char)(s, n, p[0], maxcount);
769 : : }
770 : : }
771 : :
772 [ + + ]: 5305229 : if (mode != FAST_RSEARCH) {
773 [ + + + + : 4912146 : if (n < 2500 || (m < 100 && n < 30000) || m < 6) {
+ + + + ]
774 : 4911534 : return STRINGLIB(default_find)(s, n, p, m, maxcount, mode);
775 : : }
776 [ + - ]: 612 : else if ((m >> 2) * 3 < (n >> 2)) {
777 : : /* 33% threshold, but don't overflow. */
778 : : /* For larger problems where the needle isn't a huge
779 : : percentage of the size of the haystack, the relatively
780 : : expensive O(m) startup cost of the two-way algorithm
781 : : will surely pay off. */
782 [ + + ]: 612 : if (mode == FAST_SEARCH) {
783 : 609 : return STRINGLIB(_two_way_find)(s, n, p, m);
784 : : }
785 : : else {
786 : 3 : return STRINGLIB(_two_way_count)(s, n, p, m, maxcount);
787 : : }
788 : : }
789 : : else {
790 : : /* To ensure that we have good worst-case behavior,
791 : : here's an adaptive version of the algorithm, where if
792 : : we match O(m) characters without any matches of the
793 : : entire needle, then we predict that the startup cost of
794 : : the two-way algorithm will probably be worth it. */
795 : 0 : return STRINGLIB(adaptive_find)(s, n, p, m, maxcount, mode);
796 : : }
797 : : }
798 : : else {
799 : : /* FAST_RSEARCH */
800 : 393083 : return STRINGLIB(default_rfind)(s, n, p, m, maxcount, mode);
801 : : }
802 : : }
803 : :
|