算法步骤
- 构建trie树
- 构造AC自动机
- 查询出现次数
- 与KMP算法的比较
注意一下几点:
- 字典树数组,ch[N][26],cnt[N],idx分别表示的意义
- ne[N]表示回跳边,ch表示树边和转移边。回跳边和转移边的定义看步骤二。儿子存在给儿子建立回跳边,不存在则给自己建立转移边。
- 查询步骤,如果可以贡献累加的话,则不用标记数组cnt为-1.
模板题
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;
int ch[N][26],idx,cnt[N],ne[N];
char s[N],t[N];
void insert(char *s){
int p=0;
for(int i=0;s[i];i++){
int t=s[i]-'a';
if(!ch[p][t]) ch[p][t]=++idx;
p=ch[p][t];
}
cnt[p]++;
}
void build(){
queue<int> q;
for(int i=0;i<26;i++){
if(ch[0][i]) q.push(ch[0][i]);
}
while(q.size()){
int u=q.front();
q.pop();
for(int i=0;i<26;i++){
int v=ch[u][i];
if(v) ne[v]=ch[ne[u]][i],q.push(v);
else ch[u][i]=ch[ne[u]][i];
}
}
}
int query(char *s){
int ans=0;
for(int k=0,i=0;s[k];k++){
i=ch[i][s[k]-'a'];
for(int j=i;j&&~cnt[j];j=ne[j]){
ans+=cnt[j],cnt[j]=-1;//这里如果可以多次贡献累加的话,则不用标记cnt数组
}
}
return ans;
}
int main(){
int n;cin>>n;
for(int i=1;i<=n;i++){
cin>>s;
insert(s);
}
cin>>t;
build();
cout<<query(t);
return 0;
}
应用
单词
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;
int ch[N][26],idx,cnt[N],id[N],ne[N];
char s[N];
int q[N];
void insert(int x){
int p=0;
for(int i=0;s[i];i++){
int t=s[i]-'a';
if(!ch[p][t]) ch[p][t]=++idx;
p=ch[p][t];
cnt[p]++;
}
id[x]=p;
}
void build(){
int hh=0,tt=-1;
for(int i=0;i<26;i++){
if(ch[0][i]) q[++tt]=ch[0][i];
}
while(hh<=tt){
int u=q[hh++];
for(int i=0;i<26;i++){
int &p=ch[u][i];
if(p) ne[p]=ch[ne[u]][i],q[++tt]=p;
else p=ch[ne[u]][i];
}
}
}
int main(){
int n;cin>>n;
for(int i=0;i<n;i++){
cin>>s;
insert(i);
}
build();
for(int i=idx-1;~i;i--) cnt[ne[q[i]]]+=cnt[q[i]];
for(int i=0;i<n;i++) cout<<cnt[id[i]]<<endl;
return 0;
}