概念须知
s[]模式串 p[]模板串 s较长,在s中寻找p
真前缀:除了自身以外,一个字符串的全部头部组合;
真后缀:除了自身以外,一个字符串的全部尾部组合;
核心思想:在每次失配时,不是把p串往后移一位,而是把p串往后移动至下一次可以和前面部分匹配的位置,这样就可以跳过大多数的失配步骤。而每次p串移动的步数就是通过查找next[ ]数组确定的。
next[]模拟:next数组用来存模式串中每个前缀最长的能匹配前缀子串的结尾字符的下标。
#include<bits/stdc++.h>
using namespace std;
const int N=1e7+10;
char s[N],p[N];
int n,m;
int ne[N];
int main(){
cin>>n>>p+1;
cin>>m>>s+1;
//求next[]数组
for(int i=2,j=0;i<=n;i++){
while(j&&p[i]!=p[j+1])j=ne[j];
if(p[i]==p[j+1]) j++;
ne[i]=j;
}
//匹配操作
for(int i=1,j=0;i<=m;i++){
while(j&&s[i]!=p[j+1]) j=ne[j];
//如果j有对应p串的元素, 且s[i] != p[j+1], 则失配, 移动p串
//用while是由于移动后可能仍然失配,所以要继续移动直到匹配或整个p串移到后面(j = 0)
if(s[i]==p[j+1])j++;//当前元素匹配,j移向p串下一位
if(j==n) {
cout<<i-n<<" ";
j=ne[j];//继续匹配下一个子串
}
}
return 0;
}