【YbtOJ AC自动机 - 2】单词频率

单词频率


题目

某人读论文,一篇论文是由许多单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次


输入

第一行一个整数 N N N,表示有多少个单词,接下来 N N N 行每行一个单词

输出

输出 N N N 个整数,第 i i i 行的数字表示第 i i i个单词在文章中出现了多少次


输入样例

3
a
aa
aaa

输出样例

6
3
1

解题思路

我们这题要先跑一遍 A C AC AC自动机,然后求出 A C AC AC自动机上的每一个节点到根形成的字符串是多少个单词的前缀
然后我们要按 B F S BFS BFS的倒序计算,保证无后效性


程序如下

#include<algorithm>
#include<iostream>
#include<cstring>
#include<cstdio>

using namespace std;

int n, tot, cnt;
int f[1000001], ch[1000001][31], sum[1000001], q[1000001], nxt[1000001], r1[1000001];

char s[1000001];

void add()
{
	int len = strlen(s);
	int u = 0;
	for(int i = 0; i < len; ++i)
	{
		if(!ch[u][s[i] - 'a']) ch[u][s[i] - 'a'] = ++tot;
		sum[u]++;//经过的节点
		u = ch[u][s[i] - 'a'];
	}
	sum[u]++;
	f[++cnt] = u;//沿途记录每一个插入的字符串在图中的末尾
	return ;
}

void bfs()
{
	int q1 = 1, q2 = 0;
	for(int i = 0; i <= 25; ++i)
	{ 
		if(ch[0][i]) 
		{
			q[++q2] = ch[0][i];
			nxt[ch[1][i]] = 0;
		}
	}
	for(q1 = 1; q1 <= q2; ++q1)
	{
		int u = q[q1];
		for(int i = 0; i <= 25; ++i)
		{
			if(!ch[u][i]) ch[u][i] = ch[nxt[u]][i];
			else
			{
				q[++q2] = ch[u][i];
				nxt[ch[u][i]] = ch[nxt[u]][i];
			}
		}
	}
	for(int i = tot; i >= 1; --i)
		r1[q[i]] = sum[q[i]];
	for(int i = tot; i >= 1; --i)
		r1[nxt[q[i]]] += r1[q[i]];
}

int main()
{
	scanf("%d",&n);
	for(int i = 1; i <= n; ++i)
	{
		scanf("%s", s);
		add();		
	}
	bfs();
	for(int i = 1; i <= n; ++i)
		printf("%d\n",r1[f[i]]);
	return 0;
}
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值