AC自动机[病毒侵袭持续中]

这道题也是个板子题,和上一题很像,就是多个计数和储存,详解在上一个博文中,然后这个题说一下maxn的问题,一定一定在数组取大小的时候要+5/+10,尤其是手动赋大小比如ans[1000]就很容易忘,忘了就jj,然后明明自己算法对的还MLE那应该是自己把数值范围搞错了,这个题我就搞大了10倍一直MLE,一般OJ也就允许10倍的正确算法的空间,给了32MB,然后我开大十倍就很不稳定,在34-54MB之间跳,后来发现自己开大了。。。。。

病毒侵袭持续中

Problem Description

小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?

Input

第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。

Output

按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。
病毒特征码: 出现次数
冒号后有一个空格,按病毒特征码的输入顺序进行输出。

Sample Input

3

AA

BB

CC

ooxxCC%dAAAoen....END

Sample Output

AA: 2

CC: 1

Hint

Hit: 题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。 计数策略也可一定程度上从Sample中推测。

Source:HDU3056

#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <string.h>
#include<iostream>
#include<algorithm>
using namespace std;
typedef long long ll;
const int maxn=5e4+10;
const int maxntext=2e6+10;
int trie[maxn][26],fail[maxn],queue[maxn],front,rear,cnt,idx[maxn],ans[1005];
char text[maxntext],word[1005][55];
void buildtrie(char *w,int n)
{
    int  len,c,u=0;
    len=strlen(w);
    for(int i=0;i<len;i++)
    {
        c=w[i]-'A';
        if(trie[u][c]==0)
            trie[u][c]=++cnt;
        u=trie[u][c];
    }
    idx[u]=n;//记录一下这个word对应的是第几个输入的(把字符串对应起来) 
}
void buildfail()
{
	int u=0;
		for(int i=0;i<26;i++)
			    if(trie[u][i])
		    queue[rear++]=trie[u][i];
	while(front<rear)
	{
		u=queue[front++];
		for(int i=0;i<26;i++)
		{
			if(trie[u][i])
			{
				fail[trie[u][i]]=trie[fail[u]][i];
				queue[rear++]=trie[u][i];
			}
			else
			    trie[u][i]=trie[fail[u]][i];
		}
	}
}
void query(char *t)
{
    int len,c,u=0;
    len=strlen(t);
    for(int i=0;i<len;i++)
    {
        c=t[i]-'A';
        if(c<0||c>26)
        {
            u=0;
            continue;
        }
        u=trie[u][c];
        for(int j=u;j;j=fail[j])
        {
            if(idx[j])
                ans[idx[j]]++;//这个题说了没重复的 
        }
    }
}
int main()
{
    int n;
    while(scanf("%d",&n)!=EOF)
{
    memset(trie,0,sizeof(trie));
    memset(fail,0,sizeof(fail));
    memset(ans,0,sizeof(ans));
    memset(idx,0,sizeof(idx));
    cnt=front=rear=0;
    getchar();
    for(int i=1;i<=n;i++)
    {
        scanf("%s",word[i]);
        buildtrie(word[i],i);
    }
    buildfail();
    scanf("%s",text);
    query(text);
    for(int i=1;i<=n;i++)
    {
        if(ans[i]!=0)
        printf("%s: %d\n",word[i],ans[i]);
    }
}
    return 0;
}

2021.8.4

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python AC动机是一个用于字符串匹配的算法,它可以高效地在一段文本查找多个预定义的模式。它的实现可以使用多种库,其包括ac动机python和ahocorasick-python。 ac动机python是一个对标准的ac动机算法进行了完善和优化的实现,适用于主流的Python发行版,包括Python2和Python3。它提供了更准确的结果,并且可以通过pip进行安装,具体的安装方法可以参考官方文档或者使用pip install命令进行安装。 ahocorasick-python是另一个实现AC动机的库,它也可以用于Python2和Python3。你可以通过官方网站或者GitHub源码获取更多关于该库的信息和安装指南。 对于AC动机的使用,一个常见的例子是在一段包含m个字符的文章查找n个单词出现的次数。要了解AC动机,需要有关于模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC动机的算法包括三个步骤:构造一棵Trie树,构造失败指针和模式匹配过程。在构造好AC动机后,可以使用它来快速地在文本查找预定义的模式,并统计它们的出现次数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [ahocorasick-python:AC动机python的实现,并进行了优化。 主要修复了 查询不准确的问题](https://download.csdn.net/download/weixin_42122986/18825869)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python实现多模匹配——AC动机](https://blog.csdn.net/zichen_ziqi/article/details/104246446)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值