1.KR算法是什么?
KR算法,在简单模式匹配算法的基础上,引入字符串hash计算,避免了对字符串的重复比较。
2.描述
KR算法的原理如下:
- 计算匹配串和主串一定长度子串的hash值。
- 若2个hash值一致,则从当前索引向后,逐字比较主串和匹配串。
- 否则,主串索引+1,重新计算当前hash,重复步骤2。
3.示例
/*
* RK匹配
*/
char *RK(char *text, char *pattern) {
if (text == NULL) return NULL;
int tlength = strlen(text);
int plength = strlen(pattern);
int phash = 0, thash = 0, max = 1;
// 参考JDK1.8 String的hashCode方法
for (int i = 0; i < plength; i++) {
phash = 31 * phash + pattern[i];
thash = 31 * thash + text[i];
max *= 31;
}
for (int i = 0; i < tlength; i++) {
if (phash == thash) {
int j = 0;
while (j < plength && text[i++] == pattern[j++])
;
if (j != plength)
i = i - j + 1;
else
return text + i - j;
} else {
// 减去最高位的hash值,加上最低位的值,以保证hash计算的时间复杂度=O(1)
thash = thash* 31 - text[i] * max + text[i + plength];
}
}
return NULL;
}