【模板】KMP字符串匹配
题目描述
KMP算法是怎么实现的呢?
我们假定一个字符串BDCDACABCDABCDA,与模式串ABCDABC,我们一般用暴力法求解的话,要一个一个去匹配字符,很浪费时间,并且,模式串里匹配留下的信息也没用上,这时候我们就要用到KMP算法了。
前缀与后缀
要了解两个概念:前缀和后缀。 前缀指除了最后一个字符以外,一个字符串的全部头部组合,后缀指除了第一个字符以外,一个字符串的全部尾部组合。
像模式串中:
前缀为:A,AB,ABC,ABCD,ABCDA,ABCDAB
后缀为:BCDABC,CDABC,DABC,ABC,BC,C
部分匹配值
部分匹配值就是前缀与后缀的最大共有部分的长度
模式串中前缀与后缀最大公有长度为ABC,所以部分匹配值为3。
所以模式串中每个字符的部分匹配值为:
A B C D A B C
0 0 0 0 1 2 3
知道部分匹配值有什么用呢?
当我们匹配失败的时候,我们移动模式串是的:
移动位数 = 已匹配的字符数 - 对应的部分匹配值
怎样计算部分匹配值呢?
cin>>s1+1>>s2+1;
int l1=strlen(s1+1),l2=strlen(s2+1);
int i,j=0;//j表示模式串匹配到第几位了
for(i=2;i<=l2;i++)//开始匹配自己,i表示后缀,从2开始
{
while(j&&s2[i]!=s2[j+1])//找到前缀于后缀重合的最长长度
j=n[j];//如果不匹配 ,那么就向回跳,直到可以继续匹配
if(s2[j+1]==s2[i])//如果相等了,就将下标加一,继续,通过自己匹配自己来得出每一个点的kmp值
j++;
n[i]=j;//如果i+1失配后应该如何跳
}
本题的输入格式
第一行为一个字符串,即为s 1。
第二行为一个字符串,即为s 2。
输出格式
输入 #1
ABABABC
ABA
输出 #1
1
3
0 0 1
代码
#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
int n[1001000];
char s1[1001000],s2[1001000];
int main()
{
```cin>>s1+1>>s2+1;
int l1=strlen(s1+1),l2=strlen(s2+1);
int i,j=0;//j表示模式串匹配到第几位了
for(i=2;i<=l2;i++)//开始匹配自己,i表示后缀,从2开始
{
while(j&&s2[i]!=s2[j+1])//找到前缀于后缀重合的最长长度
j=n[j];//如果不匹配 ,那么就向回跳,直到可以继续匹配
if(s2[j+1]==s2[i])//如果相等了,就将下标加一,继续,通过自己匹配自己来得出每一个点的kmp值
j++;
n[i]=j;//如果i+1失配后应该如何跳
}
j=0;
for(i=1;i<=l1;i++)
{
while(j&&s2[j+1]!=s1[i])
j=n[j];//如果失配 ,那么就不断向回跳,直到可以继续匹配
if(s2[j+1]==s1[i])//如果匹配成功,那么对应的模式串位置++
j++;
if(j==l2)
cout<<i+1-l2<<endl;
}
for(i=1;i<=l2;i++)
cout<<n[i]<<' ';
}