AC自动机:例题与机制详解

54 篇文章 0 订阅
34 篇文章 0 订阅

介绍

AC自动机是kmp算法trie树的结合
大体就是做这样的题用:
在这里插入图片描述
可以发现,这题和trie树的区别是把多个单词往一篇文章匹配,而trie恰好相反
匹配的时候其实就是判断子串,所以又用到了kmp
定义失配指针nxt[i]:表示root到nxt[i]结点的字符串是到 i 结点的字符串的在本树中的最长后缀(其实和kmp差不多啦)
设文章下一个字是s,当前trie树结点是a
每次发现a结点下方没有s的儿子(膝下无子 ) 就回去重新找失配指针
现在考虑处理失配指针
因为显然nxt[i]的深度小于i,所以采用bfs,从而保证当前结点以上的所有的结点的nxt都解决完

核心代码

void solve(){
	for(int i=1;i<=26;i++) tree[0][i]=1;
	int q[N]={};
	q[1]=1;nxt[1]=0;
	for(int st=1,ed=1;st<=ed;st++){
		int now=q[st];
		for(int i=1;i<=26;i++){
			if(!tree[now][i]) tree[now][i]=tree[nxt[now]][i];
			else{
				q[++ed]=tree[now][i];
				int v=nxt[now];
				nxt[tree[now][i]]=tree[v][i];
			}
		}
	}
}

看代码也可以发现,当tree[i][j]无定义时,直接指向了它的失配指针
然后就好办了

void ac(){
	int p=1;
	int l=strlen(s+1);
	for(int i=1;i<=l;i++) a[i]=s[i]-'a'+1;
	for(int i=1;i<=l;i++){
		p=tree[p][a[i]];
		int k=p;
		while(k>1){//防止遗漏
			ans+=end[k];
			end[k]=0;//本题需要清零
			k=nxt[k];
		}
	}
	return;
}

例题代码

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<map>
#include<vector>
#include<queue>
#include<stack>
#include<deque>
#include<set>
#include<string>
#include<iostream>
#include<climits>
#define mem(a,b) memset(a,b,sizeof(a));
using namespace std;
const int M=1000050;
const int N=100050;
const int mod=100003;
typedef pair<int,int>pr;
int m,n,k,b,c,d;
int num=1,tree[N][28],end[M];
char s[M];
int a[M];
void add(){
	int l1=strlen(s+1);
	for(int i=1;i<=l1;i++) a[i]=s[i]-'a'+1;
	int u=1;
	for(int i=1;i<=l1;i++){
		if(!tree[u][a[i]]) tree[u][a[i]]=++num;
		u=tree[u][a[i]];
	}
	end[u]++;
}
int nxt[N];
void solve(){
	for(int i=1;i<=26;i++) tree[0][i]=1;
	int q[N]={};
	q[1]=1;nxt[1]=0;
	for(int st=1,ed=1;st<=ed;st++){
		int now=q[st];
		for(int i=1;i<=26;i++){
			if(!tree[now][i]) tree[now][i]=tree[nxt[now]][i];
			else{
				q[++ed]=tree[now][i];
				int v=nxt[now];
				nxt[tree[now][i]]=tree[v][i];
			}
		}
	}
}
int ans=0;
void ac(){
	int p=1;
	int l=strlen(s+1);
	for(int i=1;i<=l;i++) a[i]=s[i]-'a'+1;
	for(int i=1;i<=l;i++){
		p=tree[p][a[i]];
		int k=p;
		while(k>1){
			ans+=end[k];
			end[k]=0;
			k=nxt[k];
		}
	}
	return;
}
int main(){
	scanf("%d",&k);
	while(k--){
		mem(tree,0);mem(end,0);
		ans=0;num=1;
		scanf("%d",&n);
		for(int i=1;i<=n;i++){
			scanf("%s",s+1);
			add();
		}
		scanf("%s",s+1);
		solve();
		ac();
		printf("%d\n",ans);
	}
}
/*
1
5
she
he
say
shr
her
yasherhs
*/

thanks for reading!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值