字符串匹配算法——RK算法(Rabin-Karp)
欢迎关注个人公众号:程序员宅急送
公众号微信号:Geek_Zhai
BF算法的特点就是简单粗暴直接,好理解,它的时间复杂度是O(n*m)。那能不能再优化一下呢?再快一点!
这就是本篇文章要讲的RK算法(Rabin-Karp),这其实是两位大佬的名字。
算法核心思想:
利用哈希值匹配更快的优点来加快字符串匹配的速度。
我们先求出主串所有长度与模串相等的子串,将子串与模串的hash值相比较,相等的话就说明两个字符串相等(此处暂时不考虑hash冲突)
原理如下图:
代码如下:
class Solution
{
public:
int RK(const string& src,const string& dst)
{
int srcLength = src.size();
int dstLength = dst.size();
powValue = new int[dstLength-1];
hashValue = new int[srcLength-dstLength+1];
for(int i=0;i<dstLength;++i)
{
powValue[i]=1;
for(int j =i;j>0;--j)
{
powValue[i]*=26;
}
}
//计算子串的hash值
int dstHash = 0;
for(int j = 0;j<dstLength;++j)
{
dstHash+= powValue[dstLength-j-1]*(dst[j]-'a');
}
//首先计算第一个子串的hash值
hashValue[0]=0;
for(int j = 0;j<dstLength;++j)
{
hashValue[0]+= powValue[dstLength-j-1]*(src[j]-'a');
}
if(hashValue[0]==dstHash)
return 0;
for(int i =1;i<srcLength;++i)
{
//此处有一个小技巧~通过前一个子串的hash值计算当前的hash值
hashValue[i]=(hashValue[i-1]-powValue[dstLength-1]*(src[i-1]-'a'))*26+(src[i+dstLength-1]-'a');
if(hashValue[i]==dstHash)
return i;
}
return -1;
}
int* powValue;//申请内存提前保存26进制值,减少计算时间。
int* hashValue;//储存已经计算过的子串的hash值。
};