算法步骤
- 构建trie树
- 构造AC自动机
- 查询出现次数
- 与KMP算法的比较
注意一下几点:
- 字典树数组,ch[N][26],cnt[N],idx分别表示的意义
- ne[N]表示回跳边,ch表示树边和转移边。回跳边和转移边的定义看步骤二。儿子存在给儿子建立回跳边,不存在则给自己建立转移边。
- 查询步骤,如果可以贡献累加的话,则不用标记数组cnt为-1.
模板题
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;
int ch[N][26],idx,cnt[N],ne[N];
char s[N],t[N];
void insert(char *s){
int p=0;
for(int i=0;s[i];i++){
int t=s[i]-'a';
if(!ch[p][t]) ch[p][t]=++idx;
p=ch[p][t];
}
cnt[p]++;
}
void build(){
queue<int> q;
for(int i=0;i<26;i++){
if(ch[0][i]) q.push(ch[0][i]);
}
while(q.size()){
int u=q.front();
q.pop();
for(int i=0;i<26;i++){
int v=ch[u][i];
if(v) ne[v]=ch[ne[u]][i],q.push(v);
else ch[u][i]=ch[ne[u]][i];
}
}
}
int query(char *s){
int ans=0;
for(int k=0,i=0;s[k];k++){
i=ch[i][s[k]-'a'];
for(int j=i;j&&~cnt[j];j=ne[j]){
ans+=cnt[j],cnt[j]=-1;//这里如果可以多次贡献累加的话,则不用标记cnt数组
}
}
return ans;
}
int main(){
int n;cin>>n;
for(int i=1;i<=n;i++){
cin>>s;
insert(s);
}
cin>>t;
build();
cout<<query(t);
return 0;
}
应用
单词
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;
int ch[N][26],idx,cnt[N],id[N],ne[N];
char s[N];
int q[N];
void insert(int x){
int p=0;
for(int i=0;s[i];i++){
int t=s[i]-'a';
if(!ch[p][t]) ch[p][t]=++idx;
p=ch[p][t];
cnt[p]++;
}
id[x]=p;
}
void build(){
int hh=0,tt=-1;
for(int i=0;i<26;i++){
if(ch[0][i]) q[++tt]=ch[0][i];
}
while(hh<=tt){
int u=q[hh++];
for(int i=0;i<26;i++){
int &p=ch[u][i];
if(p) ne[p]=ch[ne[u]][i],q[++tt]=p;
else p=ch[ne[u]][i];
}
}
}
int main(){
int n;cin>>n;
for(int i=0;i<n;i++){
cin>>s;
insert(i);
}
build();
for(int i=idx-1;~i;i--) cnt[ne[q[i]]]+=cnt[q[i]];
for(int i=0;i<n;i++) cout<<cnt[id[i]]<<endl;
return 0;
}
修复DNA
#include<bits/stdc++.h>
using namespace std;
#define int long long
#define x first
#define y second
const int N=1010,mod=1e9+7;//N尽量开贴合一点,不然过不了
int f[N][N],ne[N];
int ch[N][4],idx;
int st[N];
char p[N];
int n,m;
int get(char c) {
if(c=='A') return 0;
else if(c=='T') return 1;
else if(c=='G') return 2;
else return 3;
}
void insert(string s) {
int p=0;
for(int i=0; s[i]; i++) {
int u=get(s[i]);
int &t=ch[p][u];
if(!t) {
t=++idx;
}
p=t;
}
st[p]=1;
}
void build() {
queue<int> q;
for(int i=0; i<4; i++) {
if(ch[0][i]) q.push(ch[0][i]);
}
while(q.size()) {
auto t=q.front();
q.pop();
for(int i=0; i<4; i++) {
int &u=ch[t][i];
if(ch[t][i]==0) {
u=ch[ne[t]][i];
} else {
ne[u]=ch[ne[t]][i];
st[u]|=st[ne[u]];
q.push(u);
}
}
}
}
int num=1;
void solve() {
while(cin>>n,n) {
memset(ch,0,sizeof ch);
idx=0;
memset(ne,0,sizeof ne);
memset(st,0,sizeof st);
string s;
for(int i=0; i<n; i++) {
cin>>s;
insert(s);
}
build();
cin>>p+1;
m=strlen(p+1);
memset(f,0x3f,sizeof f);
f[0][0]=0;
for(int i=0; i<m; i++) {
for(int j=0; j<=idx; j++) {
for(int k=0; k<4; k++) {
int flag=get(p[i+1])!=k;
int u=ch[j][k];
if(!st[u]) f[i+1][u]=min(f[i+1][u],f[i][j]+flag);
}
}
}
int res=0x3f3f3f3f;
for(int i=0; i<=idx; i++) res=min(res,f[m][i]);
if(res==0x3f3f3f3f) res=-1;
printf("Case %d: %d\n", num++, res);
}
}
signed main() {
int T=1;
// cin>>T;
while(T--) {
solve();
}
return 0;
}