kmp,快速求一个字符模式串与另一字符串中相同部分数量的算法,本周刚学了点皮毛,先贴出来,下周应该还更深入要学.
大体思路:预处理模式串前缀后缀,每一个后缀匹配最大前缀(有点难懂,基本就是预处理当暴力匹配时在某个字符不相同时应该移动的最大距离)在已经匹配的模式串子串中,找出最长的相同的前缀和后缀,然后移动使它们重叠。
核心代码(基本是强行背下吴老师的代码…)
1.预处理代码,将每个位置字符匹配失败应该向右移动的最大距离存在p[]数组
void getp(int n)
{int i,j;
p[0]=-1;
j=-1;//这个很重要,因为模式串中第一个字符是不用也不可匹配
for(i=1;i<=n;i++)
{while(j>=0&&s1[j+1]!=s1[i])
{j=p[j];//不匹配,往前跳,话说这是精髓,但我还是有点不太懂,大佬可以指点下
}
j++;//后缀前缀相匹配长度++
p[i]=j;//保存
}
for(i=1;i<=n;i++)
//cout<<p[i]<<" ";
;
}
2.匹配代码,将处理好的模式串与待求串开始匹配
基本上和预处理代码思路一致,细节稍有差异.
int kmp(int n,int m)
{int i,j,ret=0;
for(i=1,j=0;i<=m;i++)//这里j从0开始了,因为是两个字符串匹配所以与预处理不同,第一个也要匹配
{while(j>=0&&s1[j+1]!=s2[i])//匹配不了了,也是往前跳
{j=p[j];
}
j++;//匹配相同长度++
if(j==n)//完全匹配,计数一次,j往前跳后继续
{ret++;
j=p[j];
}
}
return ret;
}