前言
Rabin-Karp字符串匹配算法和前面介绍的《朴素字符串匹配算法》类似,也是相应每一个字符进行比較。不同的是Rabin-Karp採用了把字符进行预处理,也就是对每一个字符进行相应进制数并取模运算,类似于通过某种函数计算其函数值,比較的是每一个字符的函数值。
预处理时间O(m)。匹配时间是O((n-m+1)m)。
Rabin-Karp算法的思想:
- 如果待匹配字符串的长度为M,目标字符串的长度为N(N>M);
- 首先计算待匹配字符串的hash值,计算目标字符串前M个字符的hash值;
- 比較前面计算的两个hash值,比較次数N-M+1:
- 若hash值不相等,则继续计算目标字符串的下一个长度为M的字符子串的hash值
- 若hash值同样。则须要使用朴素算法再次推断是否为同样的字串;
Rabin-Karp算法实现
伪代码:
Rabin_Karp_search(T, P, d, q) n = T.length; m = P.length; h = d^(m-1)mod q; p = 0; t = 0; for i =1 to m p = (d*p+P[i]) mod q; t = (d*t+T[i])mod q; for i = 0 to n-m if p==t if P[1..m]==T[i+1..i+m]