3172: [Tjoi2013]单词
Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 4293 Solved: 2083
[ Submit][ Status][ Discuss]
Description
某人读论文,一篇论文是由许多单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次。
Input
第一个一个整数N,表示有多少个单词,接下来N行每行一个单词。每个单词由小写字母组成,N<=200,单词长度不超过10^6
Output
输出N个整数,第i行的数字表示第i个单词在文章中出现了多少次。
Sample Input
3
a
aa
aaa
a
aa
aaa
Sample Output
6
3
1
3
1
第一次遇到这道题的时候,才疏学浅的我用裸的AC自动机竟然A了。。就没有多想什么
后来遇到了阿狸的打字机,听说这题的正解是fail树,于是回来练练手
首先数据很水AC自动机可以直接过
再来正解就是fail树,就是拿fail构造的树
在整个fail图中存在多少u节点所对应的字符串,在fail树中以u为根的子树就有多大
注意:
建立fail指针时,应先将fail[0]置为一个不会用到的值,否则就会遇到根0指向的单词的fail指向自己的情况,普通AC自动机的构建也应加上这个操作
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define LL long long int
#define REP(i,n) for (int i = 1; i <= (n); i++)
#define fo(i,x,y) for (int i = (x); i <= (y); i++)
#define Redge(u) for (int k = head[u]; k != -1; k = edge[k].next)
using namespace std;
const int maxn = 1000005,maxm = 205,INF = 1000000000;
//begin 18:51 End 19:04
char P[maxn];
int ch[maxn][26],fail[maxn],sum[maxn],siz = 0,n,q[maxn],head,tail,E[maxm];
void insert(int p){
int u = 0,len = strlen(P),id;
for (int i = 0; i <len; i++){
id = P[i] - 'a';
++sum[u = ch[u][id] ? ch[u][id] : ch[u][id] = ++siz];
}
E[p] = u;
}
void getf(){
head = 0; tail = 1; fail[0] = -1; int u,v;
while (head < tail){
u = q[++head];
for (int i = 0 ; i < 26; i++){
v = ch[u][i];
if (!v) ch[u][i] = ch[fail[u]][i];
else q[++tail] = v,fail[v] = ch[fail[u]][i];
}
}
}
int main()
{
cin>>n;
REP(i,n) scanf("%s",P),insert(i);
getf();
for (int i = tail; i; i--) sum[fail[q[i]]] += sum[q[i]];
REP(i,n) printf("%d\n",sum[E[i]]);
return 0;
}