kmp作用:字符串中找子串, 字符串的周期, 统计每个前缀出现次数 ,字符串压缩。
拓展kmp作用:匹配所有子串 ,本质不同子串个数 , 字符串整周期。
对于查找比较的串先求其next/z数组,next数组的时候是模式串【1,i】的最长相等前后缀,z数组是【i,n】的最长公共前缀 。
kmp匹配的时候先进行预判,如果s【i】和ss【j+1】(匹配的下一个字符串)不相同,就去前面找与当前已经匹配相同部分的后缀最长lcp,即next数组,然后最后剩下的j即是找到的与已经匹配相同部分的后缀最长lcp且下一位与当前新匹配的s【i】位相同的位置(或者j等于0,也就是不存在下一位与新匹配位相同的后缀lcp),然后如果找到s【i】==ss【j+1】,就让找到长度j++。
拓展kmp匹配的时候先判断是否可以利用前面的结果,即判断当前位置是否在盒子范围内部,如果在的话,那么最长可利用的范围就是(i,r),即r-i+1个长度。如果(l,r)与原串相同,那么对于(i,r)的位置是与(i-l+1,r-l+1)是相同的(因为l到r是从l开始的与原串的最长lcp),但对于r以后的位置和r-l+1以后的位置不一定一样,所以需要while循环一个个判断过去。
KMP
代码:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef pair<int,int> pii;
const int inf=0x3f3f3f3f;
const int N=1e6+10;
const int mod=1e9+7;
#define fi first
#define se second
#define int ll
const ll INF = -0x3f3f3f3f3f3f3f3f;
string s,ss;
int nex[N];
void get_next(string s){
nex[1]=0;
for(int i=2,j=0;i<s.size();i++){
while(j&&s[i]!=s[j+1]) j=nex[j];
if(s[i]==s[j+1]) j++;
nex[i]=j;
}
}
void get_match(){
for(int i=1,j=0;i<s.size();i++){
while(j&&s[i]!=ss[j+1]) j=nex[j];
if(s[i]==ss[j+1]) j++;
if(j==ss.size()-1) cout<<i-(ss.size()-1)+1<<endl;
}
}
void print_next(){
for(int i=1;i<ss.size();i++){
if(i>1) cout<<' ';
cout<<nex[i];
}
}
void solve(){
cin>>s>>ss;
s=' '+s;
ss=' '+ss;
get_next(ss);
get_match();
print_next();
}
signed main(){
ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
int t=1;
//cin>>t;
while(t--){
solve();
}
return 0;
}
拓展KMP
代码:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef pair<int,int> pii;
const int inf=0x3f3f3f3f;
const int N=2e7+10;
const int mod=1e9+7;
#define fi first
#define se second
#define int ll
const ll INF = -0x3f3f3f3f3f3f3f3f;
string s,ss;
int z[N],p[N];
void get_z(){
z[1]=ss.size()-1;
for(int i=2,l,r=0;i<ss.size();i++){
if(i<=r) z[i]=min(z[i-l+1],r-i+1);
while(ss[1+z[i]]==ss[i+z[i]]) z[i]++;
if(i+z[i]-1>r) l=i,r=i+z[i]-1;
}
}
void get_p(){
for(int i=1,l,r=0;i<s.size();i++){
if(i<=r) p[i]=min(z[i-l+1],r-i+1);
while(1+p[i]<ss.size()&&i+p[i]<s.size()&&ss[1+p[i]]==s[i+p[i]]) p[i]++;
if(i+p[i]-1>r) l=i,r=i+p[i]-1;
}
}
void solve(){
cin>>s>>ss;
s=' '+s;
ss=' '+ss;
ll a1=0,a2=0;
get_z();
get_p();
for(int i=1;i<ss.size();i++)
a1^=1ll*i*(z[i]+1);
for(int i=1;i<s.size();i++)
a2^=1ll*i*(p[i]+1);
cout<<a1<<endl<<a2;
}
signed main(){
ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
int t=1;
//cin>>t;
while(t--){
solve();
}
return 0;
}
马拉车
和拓展kmp一样利用盒子里已经算过的部分,再往盒子外部拓展。
代码:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef pair<int,int> pii;
const int inf=0x3f3f3f3f;
const int N=1e6+10;
const int mod=1e9+7;
#define fi first
#define se second
#define int ll
const ll INF = -0x3f3f3f3f3f3f3f3f;
string s,ss;
int d[N];
int maxx=1,pos=1;
void get_d(string s,int n){
d[1]=1;
for(int i=2,l,r=1;i<=n;i++){
if(i<=r) d[i]=min(d[r-i+l],r-i+1);
while(s[i-d[i]]==s[i+d[i]]) d[i]++;
if(i+d[i]-1>r) l=i-d[i]+1,r=i+d[i]-1;
if(d[i]>maxx){
maxx=d[i],pos=i;
}
}
}
void solve(){
cin>>s;
int n=s.size();
ss='$'+ss;
ss+='#';
for(int i=0;i<n;i++){
ss+=s[i],ss+='#';
}
n=ss.size()-1;
get_d(ss,n);
for(int i=pos-maxx+2;i<=pos+maxx-1;i+=2)
cout<<ss[i];
}
signed main(){
ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
int t=1;
//cin>>t;
while(t--){
solve();
}
return 0;
}