数据结构——AC自动机

算法步骤

  1. 构建trie树

在这里插入图片描述

  1. 构造AC自动机

在这里插入图片描述

  1. 查询出现次数

在这里插入图片描述

  1. 与KMP算法的比较
    在这里插入图片描述

注意一下几点:

  • 字典树数组,ch[N][26],cnt[N],idx分别表示的意义
  • ne[N]表示回跳边,ch表示树边和转移边。回跳边和转移边的定义看步骤二。儿子存在给儿子建立回跳边,不存在则给自己建立转移边。
  • 查询步骤,如果可以贡献累加的话,则不用标记数组cnt为-1.

模板题

原题链接

在这里插入图片描述

#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;

int ch[N][26],idx,cnt[N],ne[N];

char s[N],t[N];

void insert(char *s){
	int p=0;
	for(int i=0;s[i];i++){
		int t=s[i]-'a';
		if(!ch[p][t]) ch[p][t]=++idx;
		p=ch[p][t];
	}
	cnt[p]++;
}

void build(){
	queue<int> q;
	for(int i=0;i<26;i++){
		if(ch[0][i]) q.push(ch[0][i]);
	}
	while(q.size()){
		int u=q.front();
		q.pop();
		for(int i=0;i<26;i++){
			int v=ch[u][i];
			if(v) ne[v]=ch[ne[u]][i],q.push(v);
			else ch[u][i]=ch[ne[u]][i]; 
		}
	}
}
int query(char *s){
	int ans=0;
	for(int k=0,i=0;s[k];k++){
		i=ch[i][s[k]-'a'];
		for(int j=i;j&&~cnt[j];j=ne[j]){
			ans+=cnt[j],cnt[j]=-1;//这里如果可以多次贡献累加的话,则不用标记cnt数组 
		}
	}
	return ans;
}
int main(){
	int n;cin>>n;
	for(int i=1;i<=n;i++){
		cin>>s;
		insert(s);
	}
	cin>>t;
	build();
	cout<<query(t);
	return 0;
}

参考学习视频—董晓算法

应用

单词

原题链接

这里是引用

#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;

int ch[N][26],idx,cnt[N],id[N],ne[N];
char s[N];
int q[N];
void insert(int x){
	int p=0;
	for(int i=0;s[i];i++){
		int t=s[i]-'a';
		if(!ch[p][t]) ch[p][t]=++idx;
		p=ch[p][t];
		cnt[p]++;
	}
	id[x]=p;
}
void build(){
	int hh=0,tt=-1;
	for(int i=0;i<26;i++){
		if(ch[0][i]) q[++tt]=ch[0][i];
	}
	while(hh<=tt){
		int u=q[hh++];
		for(int i=0;i<26;i++){
			int &p=ch[u][i];
			if(p) ne[p]=ch[ne[u]][i],q[++tt]=p;
			else p=ch[ne[u]][i];
		}
	}
}

int main(){
	int n;cin>>n;
	for(int i=0;i<n;i++){
		cin>>s;
		insert(i);
	}
	build();
	for(int i=idx-1;~i;i--) cnt[ne[q[i]]]+=cnt[q[i]];
	for(int i=0;i<n;i++) cout<<cnt[id[i]]<<endl;
	return 0;
}

修复DNA

在这里插入图片描述

#include<bits/stdc++.h>
using namespace std;
#define int long long
#define x first
#define y second
const int N=1010,mod=1e9+7;//N尽量开贴合一点,不然过不了
int f[N][N],ne[N];
int ch[N][4],idx;
int st[N];
char p[N];
int n,m;

int get(char c) {
	if(c=='A') return 0;
	else if(c=='T') return 1;
	else if(c=='G') return 2;
	else return 3;
}
void insert(string s) {
	int p=0;
	for(int i=0; s[i]; i++) {
		int u=get(s[i]);
		int &t=ch[p][u];
		if(!t) {
			t=++idx;
		}
		p=t;
	}
	st[p]=1;
}
void build() {
	queue<int> q;
	for(int i=0; i<4; i++) {
		if(ch[0][i]) q.push(ch[0][i]);
	}
	while(q.size()) {
		auto t=q.front();
		q.pop();
		for(int i=0; i<4; i++) {
			int &u=ch[t][i];
			if(ch[t][i]==0) {
				u=ch[ne[t]][i];
			} else {
				ne[u]=ch[ne[t]][i];
				st[u]|=st[ne[u]];
				q.push(u);
			}
		}
	}
}
int num=1;

void solve() {
	
	while(cin>>n,n) {
		memset(ch,0,sizeof ch);
		idx=0;
		memset(ne,0,sizeof ne);
		memset(st,0,sizeof st);
		
		string s;
		for(int i=0; i<n; i++) {
			cin>>s;
			insert(s);
		}
		build();
		
		cin>>p+1;
		m=strlen(p+1);
		memset(f,0x3f,sizeof f);
		f[0][0]=0;
		for(int i=0; i<m; i++) {
			for(int j=0; j<=idx; j++) {
				for(int k=0; k<4; k++) {
					int flag=get(p[i+1])!=k;
					int u=ch[j][k];
					if(!st[u]) f[i+1][u]=min(f[i+1][u],f[i][j]+flag);
				}
			}
		}
		int res=0x3f3f3f3f;
		for(int i=0; i<=idx; i++) res=min(res,f[m][i]);
		if(res==0x3f3f3f3f) res=-1;
		printf("Case %d: %d\n", num++, res);
	}
}

signed main() {
	int T=1;
// 	cin>>T;
	while(T--) {
		solve();
	}
	return 0;
}
  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值