解析kmp算法

最新推荐文章于 2024-09-11 20:39:26 发布

喜杨杨349

最新推荐文章于 2024-09-11 20:39:26 发布

阅读量649

点赞数 9

文章标签：数据结构

本文链接：https://blog.csdn.net/2302_80194039/article/details/135981285

版权

这里介绍一下kmp，它主要应用在字符串匹配上。就是当字符串匹配不上的时候，可以知道之前已经匹配上了的部分字符串，为的就是可以减少重复运算，减少时间复杂度。话不多说，下面举例洛谷p3375模拟kmp字符串

首先主函数输出没毛病吧，输入字符串s和子串t。调用函数在字符串s中查找子串t的出现位置，并输出结果。kmp遍历输出子串t的ne数组。返回0，表示程序正常结束。代码如下：

string s,t;
int main()
{
cin>>s>>t;
kmp(s,t);
for(int i=1;i<=tlen;i++)
cout<<ne[i]<<" ";
return 0;
}

然后这里先说getnext函数，传递t进入函数，函数用于计算子串t的ne数组，函数里面将j初始化为0，k初始化为-1，并且使得ne[0]赋值为-1，之后使用while循环，判断条件为j小于子字符串的长度，如果k==-1或者t[j]==t[k]就ne[++j]=++k，否则就回溯到上一个匹配位置，代码如下：

void getnext(string t)
{
int j=0,k=-1;
ne[0]=-1;
while(j<tlen)
{
if(k==-1||t[j]==t[k])
ne[++j]=++k;
else k=ne[k] ;
}
}

下面来说kmp函数，该函数用于在字符串s中寻找子字符串t的位置，还是先初始化i和j，再获取字符串s和子字符串t的长度，这里使用了.size()函数计算长度，再调用getnext函数中的ne数组，进入while循环，同样是i小于字符串s的长度，接下来判断如果j==-1或者s[i]==t[j]就进行i++和j++，否则也是回溯到上一个位置，因为这题需要，所以当j等于子字符串t的长度时，需要输出位置，并且对j进行回溯，i会继续前进，所以不用对i更新，代码如下：

void kmp(string s,string t)
{
int i=0,j=0;
slen=s.size();
tlen=t.size();
getnext(t);
while(i<slen)
{
if(j==-1||s[i]==t[j])
{
i++;j++;
}
else j=ne[j];
if(j==tlen)
{
cout<<i-tlen+1<<endl;
j=ne[j];
}
}
}

总代码如下：

#include<bits/stdc++.h>
using namespace std;
int ne[1000010],tlen,slen;
char a,b;
void getnext(string t)
{
int j=0,k=-1;
ne[0]=-1;
while(j<tlen)
{
if(k==-1||t[j]==t[k])
ne[++j]=++k;
else k=ne[k]
;
}
}
void kmp(string s,string t)
{
int i=0,j=0;
slen=s.size();
tlen=t.size();
getnext(t);
while(i<slen)
{
if(j==-1||s[i]==t[j])
{
i++;j++;
}
else j=ne[j];
if(j==tlen)
{
cout<<i-tlen+1<<endl;
j=ne[j];
}
}
}
string s,t;
int main()
{
cin>>s>>t;
kmp(s,t);
for(int i=1;i<=tlen;i++)
cout<<ne[i]<<" ";
return 0;
}
ne数组就是一个前缀表，用来回退的，为的就是知道当子字符串与字符串不相符的时候，从该处重新开始匹配。