【AC自动机】【JSOI2007】文本生成器

1 篇文章 0 订阅
1 篇文章 0 订阅

【题目描述】

JSOI交给队员一个任务:编制一个称之为文本生成器的电脑软件。
该软件的使用者是一些低幼人群,他们现在使用的是GW文本生成器V6版。该软件可以随机生成一些文章——总是生成一篇长度固定且完全随机的文章。也就是说,生成的文章中每个字节都是完全随机的。
如果一篇文章中至少包含使用者们了解的一个单词,那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的标准,使用者现在使用的GW文本生成器所生成的文章也是几乎完全不可读的。
队员需要指出GW文本生成器v6生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?

【输入格式】

输入文件第一行包含两个正整数,分别是使用者了解的单词总数N (N <= 60),GW文本生成器v6生成文本固定长度M;以下N行,每一行包含一个使用者了解的单词。
这里所有单词及文本的长度不会超过100,并且只可能包含英文大写字母A..Z.

【输出格式】

输出文件只有一行,是一个整数,表示可能的文章总数。只需要知道结果模10007的值。


AC自动机上的DP,直接求包含很麻烦,考虑用总方案数减去不包含方案数

f[i][j]表示当前枚举长度为i,AC自动机状态为j,不包含任何一个单词的方案数

对单词构建AC自动机,对非法节点染色Dp即可

#include<iostream>
#include<iomanip>
#include<cmath>
#include<cstring>
#include<cstdio>
#include<queue>
#include<algorithm>
using namespace std;
const int mod=10007;
const int best=10000;
int n,m,root=1,tot=1,head,tail,q[6005],ans;
int f[105][6005];
bool bj[6005],vis[6005];
char s[105];
struct Tree
{
	int ch[26];
	int fail;
}tree[6005];
void insert(char *s)
{
	int len=strlen(s);
	int now=root;
	for(int i=0;i<len;i++)
	{
		int j=s[i]-'A';
		if(!tree[now].ch[j]) tree[now].ch[j]=++tot;
		now=tree[now].ch[j];
	}
	bj[now]=1;
}
void Build_AC()
{
	q[0]=1;
	while(head<=tail)
	{
		int u=q[head++];
		for(int i=0;i<26;i++)
		{
			int y=tree[u].ch[i];
			if(!y) continue;
			q[++tail]=y;
			int t=tree[u].fail;
			while(t&&!tree[t].ch[i]) t=tree[t].fail;
			if(t) tree[y].fail=tree[t].ch[i];
			else tree[y].fail=root;
		}
	}
}
void ask()
{
	f[0][1]=1;
	for(int i=1;i<=m;i++)
	{
		for(int now=1;now<=tot;now++)
		{
			for(int j=0;j<26;j++)
			{
				int nows=now;
				while(nows&&!tree[nows].ch[j]) nows=tree[nows].fail;
				if(nows) nows=tree[nows].ch[j];
				else nows=root;
				if(vis[nows]) f[i][nows]=(f[i][nows]+f[i-1][now])%mod;
			}
		}
	}
}
int mi(int x,int n)
{
	int ans=1;
	while(n)
	{
		if(n&1) ans=(ans*x)%mod;
		x=(x*x)%mod;
		n>>=1;
	}
	return ans;
}
int main()
{
	scanf("%d%d",&n,&m);
	for(int i=1;i<=n;i++)
	{
		scanf("%s",s);
		insert(s);
	}
	Build_AC();
	for(int i=1;i<=tot;i++)
	{
		vis[i]=1;
		for(int j=i;j;j=tree[j].fail) if(bj[j]) vis[i]=0;
	}
	ask();
	ans=mi(26,m);
	for(int i=1;i<=tot;i++)
	{
		ans=((ans-f[m][i])%mod+mod)%mod;
	}
	printf("%d",ans);
}

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python AC动机是一个用于字符串匹配的算法,它可以高效地在一段文本中查找多个预定义的模式。它的实现可以使用多种库,其中包括ac动机python和ahocorasick-python。 ac动机python是一个对标准的ac动机算法进行了完善和优化的实现,适用于主流的Python发行版,包括Python2和Python3。它提供了更准确的结果,并且可以通过pip进行安装,具体的安装方法可以参考官方文档或者使用pip install命令进行安装。 ahocorasick-python是另一个实现AC动机的库,它也可以用于Python2和Python3。你可以通过官方网站或者GitHub源码获取更多关于该库的信息和安装指南。 对于AC动机的使用,一个常见的例子是在一段包含m个字符的文章中查找n个单词出现的次数。要了解AC动机,需要有关于模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC动机的算法包括三个步骤:构造一棵Trie树,构造失败指针和模式匹配过程。在构造好AC动机后,可以使用它来快速地在文本中查找预定义的模式,并统计它们的出现次数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [ahocorasick-python:AC动机python的实现,并进行了优化。 主要修复了 查询不准确的问题](https://download.csdn.net/download/weixin_42122986/18825869)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python实现多模匹配——AC动机](https://blog.csdn.net/zichen_ziqi/article/details/104246446)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值