给定n个模式串和1个文本串,求有多少个模式串在文本串里出现过。
注意:是出现过,就是出现多次只算一次。
AC自动机步骤:
1:处理所有模式串,建立trie树:
2:处理fail[i]数组:(最长的(当前字符串的后缀))在Trie上可以查找到)的末尾编号。
显然fail[i]的深度一定小于i,所以可以BFS递推fail数组。
而根据fail数组的定义,对于一个点u,他的fail数组求出过了,对于他的儿子v节点(是u指向i字符的儿子),若v存在,则v的fail为:tr[fail[u]][i]
若v不存在,我们可以令tr[u][i]=tr[fail[u]][i], 这样可以使得虚节点v的父亲节点和 取代v的实节点的父亲节点的fail数组一样。
则在后面查询时可以直接跳转fail指针,不必特判考虑不存在节点的情况。
3:查询文本串,从前往后遍历文本串,由于在2中,不存在节点会有存在节点代替,所以可以一直在字典序上跑下去,过程中记录匹配成功的模式串即可。
上图方便理解:
红线代表每个点的fail指针指向的点。
紫色括号表示这个点不存在,但是这个点与括号内的点等价(其父亲节点的fail和括号内点的父亲节点的fail相同)
绿色的先表示qu函数跑文本串时,节点访问情况。 改例文本串为:ABCDBC
AC自动机这种写法比较巧妙:即把不存在节点给他等价于一个已经存在的节点,使得后面求fail和跑文本串时都能方便的跳fail。
比如求fail指针时,2,5,9,3,7,6,4号节点的fail已经求出,现在要求8号节点的fail。
考虑其父亲节点7的fail指向9号节点。表示BC(最长的(当前字符串的后缀))为:C
然后对于9号节点,其D儿子节点 不存在,但我们可以把他等价于1号节点,因为如果我们令8号的fail指向了该虚节点,就表示
BCD(最长的(当前字符串的后缀))为0.刚好符合现状,不必增加多余的判断
再考虑:求4号节点的D儿子的fail时:由于次节点不存在,所以我们直接让这个节点与tr[ fail[4]=7 ][D]=8等价。
即ABCD(最长的(当前字符串的后缀))为BCD,符合fail指针的定义,同时跑文本串时我们可以直接进行跳转,而不必增加多余的特判。
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
#define pb push_back
const int M = 1e6+7;
struct AC
{
int tr[M][26],flag[M],fail[M];
int cnt=1;
void init()
{
for(int i=0;i<=cnt;i++)fail[i]=flag[i]=0;
for(int i=1;i<=cnt;i++)
for(int j=0;j<26;j++)tr[i][j]=0;
cnt=1;
}
void in(char *s)
{
int len=strlen(s),u=1;
for(int i=0;i<len;i++)
{
int v=s[i]-'a';
if(!tr[u][v])tr[u][v]=++cnt;//新建节点
u=tr[u][v];
}
flag[u]++;//这个节点字符是几个字符串的结尾
}
void get_fail()
{
for(int i=0;i<26;i++)tr[0][i]=1;
queue<int>q;
q.push(1);fail[1]=0;
while(!q.empty())
{
int u=q.front();q.pop();
for(int i=0;i<26;i++)
{
int v=tr[u][i];//遍历u所有儿子,这样不同记录fa
int Fail=fail[u];//由于BFS遍历,fail[u]已经处理好了,现在是找v的fail
if(!v)tr[u][i]=tr[Fail][i];//不存在节点v,这样做的目的是,后面fail指针失配时直接不断返回fail
else fail[v]=tr[Fail][i],q.push(v);//存在实节点才入队列
}
}
}
int qu(char *s)
{
int u=1,ans=0,len=strlen(s);
for(int i=0;i<len;i++)
{
int v=s[i]-'a';
int k=tr[u][v];//跳fail
while(k>1&&flag[k]!=-1)//经过就不统计了
{
ans+=flag[k],flag[k]=-1;
k=fail[k];
}
u=tr[u][v];
}
return ans;
}
}ac;
char s[M],p[M];
int main()
{
ios::sync_with_stdio(false);
cin.tie(0);
int T;
cin>>T;
ac.init();
while(T--)
{
cin>>s;
ac.in(s);
}
cin>>p;
ac.get_fail();
cout<<ac.qu(p)<<endl;
return 0;
}