P3808 【模板】AC自动机(简单版)

给定n个模式串和1个文本串,求有多少个模式串在文本串里出现过

注意:是出现过,就是出现多次只算一次。

AC自动机步骤:

1:处理所有模式串,建立trie树:

2:处理fail[i]数组:(最长的(当前字符串的后缀))在Trie上可以查找到)的末尾编号。

显然fail[i]的深度一定小于i,所以可以BFS递推fail数组。

而根据fail数组的定义,对于一个点u,他的fail数组求出过了,对于他的儿子v节点(是u指向i字符的儿子),若v存在,则v的fail为:tr[fail[u]][i]

若v不存在,我们可以令tr[u][i]=tr[fail[u]][i],  这样可以使得虚节点v的父亲节点和 取代v的实节点的父亲节点的fail数组一样。

 则在后面查询时可以直接跳转fail指针,不必特判考虑不存在节点的情况。

3:查询文本串,从前往后遍历文本串,由于在2中,不存在节点会有存在节点代替,所以可以一直在字典序上跑下去,过程中记录匹配成功的模式串即可。

上图方便理解:

红线代表每个点的fail指针指向的点。

紫色括号表示这个点不存在,但是这个点与括号内的点等价(其父亲节点的fail和括号内点的父亲节点的fail相同)

绿色的先表示qu函数跑文本串时,节点访问情况。 改例文本串为:ABCDBC

AC自动机这种写法比较巧妙:即把不存在节点给他等价于一个已经存在的节点,使得后面求fail和跑文本串时都能方便的跳fail。

比如求fail指针时,2,5,9,3,7,6,4号节点的fail已经求出,现在要求8号节点的fail。

考虑其父亲节点7的fail指向9号节点。表示BC(最长的(当前字符串的后缀))为:C

然后对于9号节点,其D儿子节点 不存在,但我们可以把他等价于1号节点,因为如果我们令8号的fail指向了该虚节点,就表示

BCD(最长的(当前字符串的后缀))为0.刚好符合现状,不必增加多余的判断

 

再考虑:求4号节点的D儿子的fail时:由于次节点不存在,所以我们直接让这个节点与tr[ fail[4]=7 ][D]=8等价。

即ABCD(最长的(当前字符串的后缀))为BCD,符合fail指针的定义,同时跑文本串时我们可以直接进行跳转,而不必增加多余的特判。

#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
#define pb push_back
const int M = 1e6+7;
struct AC
{
	int tr[M][26],flag[M],fail[M];
	int cnt=1;
	void init()
	{
		for(int i=0;i<=cnt;i++)fail[i]=flag[i]=0;
		for(int i=1;i<=cnt;i++)
			for(int j=0;j<26;j++)tr[i][j]=0;
		cnt=1;
	}
	void in(char *s)
	{
		int len=strlen(s),u=1;
		for(int i=0;i<len;i++)
		{
			int v=s[i]-'a';
			if(!tr[u][v])tr[u][v]=++cnt;//新建节点
			u=tr[u][v]; 
		}
		flag[u]++;//这个节点字符是几个字符串的结尾 
	}
	void get_fail()
	{
		for(int i=0;i<26;i++)tr[0][i]=1;
		queue<int>q;
		q.push(1);fail[1]=0;
		while(!q.empty())
		{
			int u=q.front();q.pop();
			for(int i=0;i<26;i++)
			{
				int v=tr[u][i];//遍历u所有儿子,这样不同记录fa 
				int Fail=fail[u];//由于BFS遍历,fail[u]已经处理好了,现在是找v的fail
				if(!v)tr[u][i]=tr[Fail][i];//不存在节点v,这样做的目的是,后面fail指针失配时直接不断返回fail 
				else fail[v]=tr[Fail][i],q.push(v);//存在实节点才入队列 
			}
		}
	}
	int qu(char *s)
	{
		int u=1,ans=0,len=strlen(s);
		for(int i=0;i<len;i++)
		{
			int v=s[i]-'a';
			int k=tr[u][v];//跳fail 
			while(k>1&&flag[k]!=-1)//经过就不统计了
			{
				ans+=flag[k],flag[k]=-1;
				k=fail[k];
			} 
			u=tr[u][v]; 
		}
		return ans;
	}
}ac;
char s[M],p[M];
int main()
{
	ios::sync_with_stdio(false);
  	cin.tie(0);
  	int T;
  	cin>>T;
  	ac.init();
  	while(T--)
  	{
  		cin>>s;
  		ac.in(s);
	}
	cin>>p;
	ac.get_fail();
	cout<<ac.qu(p)<<endl;

	return 0;
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值