KMP
模板
在循环中,
i
i
i表示当前要去匹配第
i
i
i位,
j
j
j表示
T
T
T的前
j
j
j位和
S
S
S的前
i
−
1
i-1
i−1位可以匹配上。现在就看
T
[
j
+
1
]
T[j+1]
T[j+1]和
S
[
i
]
S[i]
S[i]是否匹配。
读入需要判断EOF。
#include<bits/stdc++.h>
#define VI std::vector<int>
#define ll long long
#define re register
#define cs const
cs int N=1e6+10;
namespace IO{
cs int Rlen=1<<22|1;
char buf[Rlen],*p1,*p2;
inline char gc(){return (p1==p2)&&(p2=(p1=buf)+fread(buf,1,Rlen,stdin),p1==p2)?EOF:*p1++;}
template<typename T>
inline T get(){
char ch=gc();T f=1,x=0;
while(!isdigit(ch)){if(ch=='-')f=0;ch=gc();}
while(isdigit(ch)) x=(x+(x<<2)<<1)+(ch^48),ch=gc();
return f?x:-x;
}
inline int gi(){return get<int>();}
inline ll gl(){return get<ll>();}
inline int get(char *s){
char ch=gc();int len=0;
while(isspace(ch)&&(~ch))ch=gc();
while((!isspace(ch))&&(~ch)) s[len++]=ch,ch=gc();
return s[len]='\0',len;
}
}
using IO::gi;
using IO::gl;
using IO::get;
namespace KMP{
inline void get_nxt(char *s,int l,int r,int *nxt){
nxt[l]=l-1;
for(int re i=l+1,j=l-1;i<=r;++i){
while((j!=l-1)&&s[i]!=s[j+1]) j=nxt[j];
if(s[i]==s[j+1]) ++j;nxt[i]=j;
}
}
inline VI match(char *s,int ls,int rs,char *t,int *nxt_t,int lt,int rt){
VI ret;int len=rt-lt+1;
for(int re i=ls,j=lt-1;i<=rs;++i){
while((j!=lt-1)&&(s[i]!=t[j+1])) j=nxt_t[j];
if(s[i]==t[j+1]) ++j;
if(j==rt) ret.push_back(i-len+1),j=nxt_t[j];
}return ret;
}
}
using namespace KMP;
char s[N],t[N];int nxt_t[N],lens,lent;VI pos;
int main(){
// freopen("3375.in","r",stdin);
lens=get(s+1),lent=get(t+1);
get_nxt(t,1,lent,nxt_t),pos=match(s,1,lens,t,nxt_t,1,lent);
for(int re i=0;i<pos.size();++i) printf("%d\n",pos[i]);
for(int re i=1;i<=lent;++i) printf("%d ",nxt_t[i]);
}
AC自动机
模板
每个匹配相当于是一个链加。差分一下即可。
要注意空儿子设为
f
a
i
l
fail
fail,免去了暴跳
f
a
i
l
fail
fail的过程。相当于是一个路径压缩。
#include<bits/stdc++.h>
#define ll long long
#define re register
#define cs const
cs int N=2e6+10,M=2e5+10,alpha=26;
namespace IO{
cs int Rlen=1<<22|1;
char buf[Rlen],*p1,*p2;
inline char gc(){return (p1==p2)&&(p2=(p1=buf)+fread(buf,1,Rlen,stdin),p1==p2)?EOF:*p1++;}
template <typename T>
inline T get(){
char ch=gc();T f=1,x=0;
while((!isdigit(ch))&&(~ch)){if(ch=='-')f=0;ch=gc();}
while((isdigit(ch))&&(~ch)) x=(x+(x<<2)<<1)+(ch^48),ch=gc();
return f?x:-x;
}
inline int gi(){return get<int>();}
inline ll gl(){return get<ll>();}
inline int gs(char *s){
char ch=gc();int len=0;
while((isspace(ch))&&(~ch)) ch=gc();
while((!isspace(ch))&&(~ch)) s[len++]=ch,ch=gc();
return s[len]='\0',len;
}
}
using IO::gi;
using IO::gl;
using IO::gs;
inline void Max(int &x,int y){if(x<y)x=y;}
int n;char s[N];
namespace AC{
int fail[M],a[M][alpha],pos[M],L[M],buc[M],p[M],sum[M],tot=0;
inline void insert(char *s,int id){
int now=0,len=strlen(s);
for(int re i=0;i<len;++i){
if(!a[now][s[i]-'a'])
a[now][s[i]-'a']=++tot;
L[a[now][s[i]-'a']]=L[now]+1;
now=a[now][s[i]-'a'];
}pos[id]=now;
}
inline void get_fail(){
std::queue<int> Q;
for(int re i=0;i<alpha;++i)
if(a[0][i]) fail[a[0][i]]=0,Q.push(a[0][i]);
while(!Q.empty()){
int u=Q.front();Q.pop();
for(int re i=0;i<alpha;++i){
if(a[u][i]) fail[a[u][i]]=a[fail[u]][i],Q.push(a[u][i]);
else a[u][i]=a[fail[u]][i];
}
}
}
inline void query(char *s){
int now=0,len=strlen(s);
for(int re i=0;i<len;++i)
++sum[now=a[now][s[i]-'a']];
int mxlen=0;
for(int re i=1;i<=tot;++i) ++buc[L[i]],Max(mxlen,L[i]);
for(int re i=1;i<=mxlen;++i) buc[i]+=buc[i-1];
for(int re i=tot;i>=1;--i) p[buc[L[i]]--]=i;
for(int re i=tot;i;--i) sum[fail[p[i]]]+=sum[p[i]];
for(int re i=1;i<=::n;++i) printf("%d\n",sum[pos[i]]);
}
}
int main(){
// freopen("5357.in","r",stdin);
n=gi();
for(int re i=1;i<=n;++i) gs(s),AC::insert(s,i);
AC::get_fail(),gs(s),AC::query(s);
}
后缀自动机
模板
要记住哪些要开两倍空间。。
或者直接都开两倍得了。。
#include<bits/stdc++.h>
#define ll long long
#define re register
#define cs const
cs int N=1e6+10;
char s[N];int n;
namespace IO{
cs int Rlen=1<<22|1;
char buf[Rlen],*p1,*p2;
inline char gc(){return (p1==p2)&&(p2=(p1=buf)+fread(buf,1,Rlen,stdin),p1==p2)?EOF:*p1++;}
template <typename T>
inline T get(){
char ch=gc();T x=0,f=1;
while((!isdigit(ch))&&(~ch)){if(ch=='-')f=0;ch=gc();}
while((isdigit(ch))&&(~ch)) x=(x+(x<<2)<<1)+(ch^48),ch=gc();
return f?x:-x;
}
inline int gi(){return get<int>();}
inline ll gl(){return get<ll>();}
inline int gs(char *s){
char ch=gc();int len=0;
while((isspace(ch))&&(~ch)) ch=gc();
while((!isspace(ch))&&(~ch)) s[len++]=ch,ch=gc();
return s[len]='\0',len;
}
}
using IO::gi;
using IO::gl;
using IO::gs;
inline void Max(ll &x,ll y){if(x<y)x=y;}
namespace SAM{
cs int alpha=26;
struct node{int len,link,nxt[alpha];}st[N<<1];
int last=1,sz=1;
inline void init(){
last=sz=1,st[1].len=0,st[1].link=0;
memset(st[1].nxt,0,sizeof st[1].nxt);
}
int sum[N<<1];
inline void extend(int c){
int p=last,cur=++sz;
st[cur].len=st[last].len+1,sum[cur]=1;
for(;p&&(!st[p].nxt[c]);p=st[p].link) st[p].nxt[c]=cur;
if(!p) st[cur].link=1;
else{
int q=st[p].nxt[c];
if(st[q].len==st[p].len+1) st[cur].link=q;
else{
int clone=++sz;st[clone]=st[q];
st[clone].len=st[p].len+1;
for(;p&&st[p].nxt[c]==q;p=st[p].link)
st[p].nxt[c]=clone;
st[cur].link=st[q].link=clone;
}
}last=cur;
}
int buc[N],p[N<<1];
inline ll getans(ll ans=0){
for(int re i=2;i<=sz;++i) ++buc[st[i].len];
for(int re i=2;i<=n;++i) buc[i]+=buc[i-1];
for(int re i=2;i<=sz;++i) p[buc[st[i].len]--]=i;
for(int re i=sz-1;i;--i) sum[st[p[i]].link]+=sum[p[i]];
for(int re i=2;i<=sz;++i) if(sum[i]>1) Max(ans,1ll*st[i].len*sum[i]);
return ans;
}
}
using namespace SAM;
int main(){
//freopen("3804.in","r",stdin);
n=gs(s),init();
for(int re i=0;i<n;++i) extend(s[i]-'a');
printf("%lld\n",getans());
}