题目链接
Description
某人读论文,一篇论文是由许多单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次。
Input
第一个一个整数 N, 表示有多少个单词,接下来 N 行每行一个单词。每个单词由小写字母组成,N<=200, 单词长度不超过 10^6Output
输出 N 个整数,第 i 行的数字表示第 i 个单词在文章中出现了多少次。
Sample Input
3
a
aa
aaaSample Output
6
3
1
题意
- 给我们 n 个字符串,求每个字符串 i 在 n 个字符串中出现的总次数。
思路
- 很经典的一道题,
- 我们考虑如果第 i 个字符串作为子串出现在其他字符串中(假设出现在 j 字符串的 x 位置),那么必然 x 字符的 fail 指针是指向 i 字符串的末位置(是在 ac 自动机上的节点位置),
- 因此我们只需要从最后一层往前,往第一层,一层一层的往前遍历递推就能把 x 位置的贡献递推累加给 i 字符的贡献。
代码
#include <bits/stdc++.h>
using namespace std;
const int N = 1e6 + 10;
int tr[N][26], fa[N], idx;
int num[N], id[N];
char s[N];
int q[N];
void insert(char s[], int i)
{
int u = 0;
for (int i = 0; s[i]; i ++)
{
if (tr[u][s[i] - 'a'] == 0) tr[u][s[i] - 'a'] = ++ idx; //注意是前缀 ++
u = tr[u][s[i] - 'a'];
num[u] ++;
}
id[i] = u;
}
void build()
{
int hh = 0, tt = -1;
for (int i = 0; i < 26; i ++)
{
if (tr[0][i]) q[++ tt] = tr[0][i];
}
while (hh <= tt)
{
int u = q[hh ++];
for (int i = 0; i < 26; i ++)
{
int v = tr[u][i];
if (v)
{
fa[v] = tr[fa[u]][i];
q[++ tt] = v;
}
else
tr[u][i] = tr[fa[u]][i];
}
}
}
int main()
{
int n; scanf("%d", &n);
for (int i = 1; i <= n; i ++)
{
scanf("%s", s);
insert(s, i);
}
build();
for (int i = idx - 1; i >= 0; i --) //i 从 idx-1 开始是因为,q 中存储了 idx 个节点在 build 的过程中,而存储的下表是从 0 开始的,
{ //所以从后往前 typp_sort 的时候最后一层的最后一个节点的下标是 idx-1
num[fa[q[i]]] += num[q[i]];
}
for (int i = 1; i <= n; i ++)
{
printf("%d\n", num[id[i]]);
}
return 0;
}