关闭

AC自动机(3)--hdu3065(病毒侵袭持续中)(基础题)

标签: hdu3065AC自动机AC自动机模板病毒持续侵袭中
202人阅读 评论(0) 收藏 举报
分类:
 病毒侵袭持续中

                                              Time Limit:1000MS    Memory Limit:32768KB    64bit IO Format:%I64d & %I64u


Description

小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?

Input

第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。

Output

按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。
病毒特征码: 出现次数
冒号后有一个空格,按病毒特征码的输入顺序进行输出。

Sample Input

3
AA
BB
CC
ooxxCC%dAAAoen....END

Sample Output

AA: 2
CC: 1

Hint

题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。 计数策略也可一定程度上从Sample中推测。


              这道题主要就是本题需要注意的地方是可重叠匹配,直接上模板就好,在字典树id上做点小手脚换为字串的ID,在最后匹配的时候非大写英文字母我们直接让返回到root就可以,其他的就没什么了。上代码:

#include<stdio.h>
#include<string.h>
#include<queue>
#include<malloc.h>
using namespace std;
char str[2000005];
int cnt[1005]; //此数组存该序号的字串出现的次数
struct node{
	int cnt;       //存字串id
	node *next[30];
	node *fail;
	node(){
		cnt=0;
		memset(next,NULL,sizeof(next));
		fail=NULL;
	}
};
node *root;
void insert(char str[],int num){
	int i;
	node *p=root;
	int len=strlen(str);
	for(i=0;i<len;i++){
		int index=str[i]-'A';
		if(p->next[index]==NULL){
			p->next[index]=new node();
			p=p->next[index];
		}
		else p=p->next[index];
	}
	p->cnt=num;
}
void GetFail(){
	int i;
	node *p=root;
	queue<node *>q;
	q.push(root);
	while(!q.empty()){
		p=q.front();
		q.pop();
		for(i=0;i<26;i++){
			if(p->next[i]==NULL)continue;
			q.push(p->next[i]);
			if(p==root)p->next[i]->fail=root;
			node *temp=p->fail;
			while(temp!=NULL){
				if(temp->next[i]!=NULL){
					p->next[i]->fail=temp->next[i];
					break;
				}
				else temp=temp->fail;
				if(temp==NULL)p->next[i]->fail=root;
			}
		}
	}
}
void Query(char str[]){
	node *p=root;
	int len=strlen(str);
	int i;
	for(i=0;i<len;i++){
		int index=str[i]-'A';
		if(index<0||index>25)index=26;
		while(p->next[index]==NULL&&p!=root){
			p=p->fail;
		}
		if(p->next[index]==NULL)continue;
		p=p->next[index];
		node *temp=p;
		while(temp->cnt!=0&&temp!=root){
			cnt[temp->cnt]++;           //注意这儿不应该将temp->cnt的值赋为0,因为AAA中AA的出现次数为2而不是1
			temp=temp->fail;
		}
	}
}
int main()
{
	int i,n;
	char str1[1002][52];
	while(scanf("%d",&n)!=EOF){
		root=new node();
		memset(cnt,0,sizeof(cnt));
		for(i=1;i<=n;i++){
			scanf("%s",str1[i]);
			insert(str1[i],i);
		}
		GetFail();
		scanf("%s",str);
		Query(str);
		for(i=1;i<=n;i++){
			if(cnt[i]>0)
				printf("%s: %d\n",str1[i],cnt[i]);
		}
	}
	return 0;
}


1
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:45199次
    • 积分:1586
    • 等级:
    • 排名:千里之外
    • 原创:105篇
    • 转载:38篇
    • 译文:0篇
    • 评论:3条
    最新评论