题目链接
题意:
给你n个字符串,求每个字符串在所有字符串中出现了几次。
题解:
需要字符串匹配,还是多串匹配,不难想到要AC自动机。但是不能直接用AC自动机匹配,因为可能是另一个串的子串。我们考虑建AC自动机的过程,我们在一个一个插入字符串的过程中,一旦经过了trie树上的某个节点,就意味着根到该节点的字符串又出现了一次,所以建trie树时一路上给每个经过节点的经过次数都加一,并且记录每个串最终的结束节点在trie树上的标号。但是由于每个字符串还可能出现在别的串的子串里,所以我们还要利用fail指针。我们考虑fail指针的含义,根到fail指针其实可以表示当前字符串的一个后缀,那么当前串出现了几次,它的后缀也相应的出现了几次,所以我们应该在fail[i]处加上i处的次数。而fail指针指向的节点深度肯定不大于当前节点,所以我们就要从深度大的向深度小的更新,而这个深度是可以按照建fail指针被遍历到的顺序依次单调不降的,于是我们倒叙枚举构建fail指针时被遍历的顺序来更新答案即可。
代码:
#include <bits/stdc++.h>
using namespace std;
int n,ans[1000010],pos[1000010];//pos记录每个字符串最后一个字符在trie上对应节点的编号
int fail[1000010],ch[1000010][26],cnt;
int xu[1000010],ji;//ji记录建fail指针时被访问的顺序
queue <int> q;
char s[1000010];
inline void build(int x)
{
int cur=0;
for(int i=0;i<strlen(s);++i)
{
if(!ch[cur][s[i]-'a'])
ch[cur][s[i]-'a']=++cnt;
cur=ch[cur][s[i]-'a'];
++ans[cur];
}
pos[x]=cur;
}
inline void get_fail()
{
for(int i=0;i<=25;++i)
{
if(ch[0][i])
{
fail[ch[0][i]]=0;
q.push(ch[0][i]);
}
}
xu[++ji]=0;
while(!q.empty())
{
int x=q.front();
q.pop();
xu[++ji]=x;
for(int i=0;i<=25;++i)
{
if(ch[x][i])
{
q.push(ch[x][i]);
fail[ch[x][i]]=ch[fail[x]][i];
}
else
ch[x][i]=ch[fail[x]][i];
}
}
}
int main()
{
scanf("%d",&n);
for(int i=1;i<=n;++i)
{
scanf("%s",s);
build(i);
}
get_fail();
for(int i=ji;i>=1;--i)
ans[fail[xu[i]]]+=ans[xu[i]];
for(int i=1;i<=n;++i)
printf("%d\n",ans[pos[i]]);
return 0;
}