这里介绍一下kmp,它主要应用在字符串匹配上。就是当字符串匹配不上的时候,可以知道之前已经匹配上了的部分字符串,为的就是可以减少重复运算,减少时间复杂度。话不多说,下面举例洛谷p3375模拟kmp字符串
首先主函数输出没毛病吧,输入字符串s和子串t。调用函数在字符串s中查找子串t的出现位置,并输出结果。kmp遍历输出子串t的ne数组。返回0,表示程序正常结束。代码如下:
string s,t;
int main()
{
cin>>s>>t;
kmp(s,t);
for(int i=1;i<=tlen;i++)
cout<<ne[i]<<" ";
return 0;
}
然后这里先说getnext函数,传递t进入函数,函数用于计算子串t的ne数组,函数里面将j初始化为0,k初始化为-1,并且使得ne[0]赋值为-1,之后使用while循环,判断条件为j小于子字符串的长度,如果k==-1或者t[j]==t[k]就ne[++j]=++k,否则就回溯到上一个匹配位置,代码如下:
void getnext(string t)
{
int j=0,k=-1;
ne[0]=-1;
while(j<tlen)
{
if(k==-1||t[j]==t[k])
ne[++j]=++k;
else k=ne[k] ;
}
}
下面来说kmp函数,该函数用于在字符串s中寻找子字符串t的位置,还是先初始化i和j,再获取字符串s和子字符串t的长度,这里使用了.size()函数计算长度,再调用getnext函数中的ne数组,进入while循环,同样是i小于字符串s的长度,接下来判断如果j==-1或者s[i]==t[j]就进行i++和j++,否则也是回溯到上一个位置,因为这题需要,所以当j等于子字符串t的长度时,需要输出位置,并且对j进行回溯,i会继续前进,所以不用对i更新,代码如下:
void kmp(string s,string t)
{
int i=0,j=0;
slen=s.size();
tlen=t.size();
getnext(t);
while(i<slen)
{
if(j==-1||s[i]==t[j])
{
i++;j++;
}
else j=ne[j];
if(j==tlen)
{
cout<<i-tlen+1<<endl;
j=ne[j];
}
}
}
总代码如下:
#include<bits/stdc++.h>
using namespace std;
int ne[1000010],tlen,slen;
char a,b;
void getnext(string t)
{
int j=0,k=-1;
ne[0]=-1;
while(j<tlen)
{
if(k==-1||t[j]==t[k])
ne[++j]=++k;
else k=ne[k]
;
}
}
void kmp(string s,string t)
{
int i=0,j=0;
slen=s.size();
tlen=t.size();
getnext(t);
while(i<slen)
{
if(j==-1||s[i]==t[j])
{
i++;j++;
}
else j=ne[j];
if(j==tlen)
{
cout<<i-tlen+1<<endl;
j=ne[j];
}
}
}
string s,t;
int main()
{
cin>>s>>t;
kmp(s,t);
for(int i=1;i<=tlen;i++)
cout<<ne[i]<<" ";
return 0;
}
ne数组就是一个前缀表,用来回退的,为的就是知道当子字符串与字符串不相符的时候,从该处重新开始匹配。