KMP(三位发明者名字首字母)
next数组表示t[j]以前最长相同前缀后缀
若下标从0开始(以下模板就采用这种方式),next[ i ] 表示前面下标0~i-1的字符串前缀和后缀相等的最大长度为 next[ i ] 。
若下标从1开始,则next[ i ] 表示前面下标1~i - 1的字符串中前缀和后缀相等的最大长度为 next[ i ] - 1
两种方式当s[i]与t[j]不同时j都应该移动到next[j]
#include "bits/stdc++.h"
#define hhh printf("hhh\n")
#define see(x) (cerr<<(#x)<<'='<<(x)<<endl)
using namespace std;
typedef long long ll;
typedef pair<int,int> pr;
inline int read() {int x=0;char c=getchar();while(c<'0'||c>'9')c=getchar();while(c>='0'&&c<='9')x=x*10+c-'0',c=getchar();return x;}
const int maxn = 1e6+10;
const int mod = 1e9+7;
const double eps = 1e-9;
char s[maxn], t[maxn];
int nxt[maxn], sl, tl;
void get() {
tl=strlen(t);
nxt[0]=-1; //nxt[0]=-1,nxt[1]=0始终成立
int i=1, j=0; //nxt[0]和nxt[1]都已经定了,因此不需要求了
while(i<tl) { //nxt[tl]用于做循环节相关题目
if(j==-1||t[i]==t[j]) ++i, ++j, nxt[i]=j;
else j=nxt[j];
}
}
int kmp() {
sl=strlen(s);
int i=0, j=0;
while(i<sl&&j<tl) {
if(j==-1||s[i]==t[j]) ++i, ++j;
else j=nxt[j];
}
if(j==tl) return i-j; //求第一个匹配位置,要求所有的话就不要退出
return -1;
}
int main() {
//ios::sync_with_stdio(false);
scanf("%s%s", s, t);
get();
printf("%d\n", kmp());
}
补充:
//nxt[i]=j;
if(s[i]!=t[j]) nxt[i]=j;
else nxt[i]=nxt[j];
//nxt[i]=j的优化版写法
例子(下标从0开始):
对于T串ababaaababaa的next数组
优化版:-1 0 -1 0 -1 3 1 0 -1 0 -1 3
本质版:-1 0 0 1 2 3 1 1 2 3 4 5
对于T串aabaabaabaab的next数组
优化版:-1 -1 1 -1 -1 1 -1 -1 1 -1 -1 1
本质版:-1 0 1 0 1 2 3 4 5 6 7 8
补充:刘CY老师模板
注意:A, B串均是从下标1开始
void pre() {
P[1]=0;
int j=0;
for(int i=1; j<m; ++i) {
while(j>0 && B[j+1]!=B[i+1]) j=P[j];
if(B[j+1]==B[i+1]) j++;
P[i+1]=j;
}
}
void kmp() {
int ans=0, j=0;
for(int i=0; i<n; ++i) {
while(j>0 && B[j+1]!=A[i+1]) j=P[j]; //不能继续匹配且j还没减少到0,减少j的值
if(B[j+1]==A[i+1]) j++; //能继续匹配,j加1
if(j==m) { //找到一处匹配
printf("%d\n", i