如何判断p(模式串)是否为s(主串)的子串?
朴素做法:
从头到尾依次遍历,然后每一次循环中从头开始对比,如果有不一致的就结束。
for(int i=1;i<=m;i++)//主串,下标从1开始
{
bool flag=true;
for(int j=0;j<n;j++)//模式串,下标从0开始
{
if(s[i]!=p[j+1])
{
flag=false;
break;
}
}
}
kmp:
在用朴素算法的过程中,可以发现:
三段标黄的位置是一样的,就是说 当我们s串(主串)第一次匹配到第5个字符,发现s[5]!=p[5],但是前面的字符是一致匹配的。
在模式串中又不难发现p[1,2]=p[3,4] (含义为在模式串p中1~2的字符串等于3~4的字符串,即"ab"="ab"),那我们就可以简化我们的对比,不需要对比这些已知的相等的元素,就是,当发现s[5]!=p[5]时,不需要从s[2]在和p[1]开始慢慢对比,可以直接从s[5]和p[3]进行性对比,因为s[3,4]=p[3,4]=p[1,2],直接从不同的开始比较即可。
其实,仔细看图,发现这和主串没有关系,我们只需要知道在模式串中已比较元素前缀和后缀相等的最大是多少,就可以直接跳过比较这些相等已知元素,其比较后面的。
next数组含义:
ne[i]=j;(p[1~j]==p[i-j+1~i],就是从1开始的前缀和以i为终点的后缀,最大匹配的长度为j)
ne[1],无意义,自己和自己相等,一般可直接从2开始。
ne[2]=0,(p[1]!=p[2],相等长度为0)
ne[3]=1,(p[1]==p[3],但p[1,2]!=p[2,3],所以最大长度为1)
p[1]==p[3],匹配长度为1
p[1,2]:"ab"
p[2,3]:"ba"
p[1,2]!=p[2,3],所以最大匹配长度为1;
以此类推:
ne[4]=2,ne[5]=3;
那我们如何在程序中求ne数组呢?
就是让p数组自己和自己匹配。
//求ne数组
for(int i=2,j=0;i<=n;i++)
{
while(j && p[i]!=p[j+1]) j=ne[j];
if(p[i]==p[j+1]) j++;
ne[i]=j;
}
整体想法就是:从p串的i开始(后缀)和p串的头开始匹配,不相同的话,就从next在开始匹配,直到相同+1,记录在next数组中。
#include <iostream>
using namespace std;
const int N = 100010, M = 1000010;
int n, m;
int ne[N];
char s[M], p[N];
int main()
{
cin>>n>>p+1>>m>>s+1;
//求ne数组
for(int i=2,j=0;i<=n;i++)
{
while(j && p[i]!=p[j+1]) j=ne[j];
if(p[i]==p[j+1]) j++;
ne[i]=j;
}
//求kmp算法
for(int i=1,j=0;i<=m;i++)
{
while(j && s[i]!=p[j+1]) j=ne[j];
if(s[i]==p[j+1]) j++;
if(j==n)
{
printf("%d ",i-n);
j=ne[j];
}
}
return 0;
}