HDU-2896 病毒侵袭 (AC自动机,模板题变形)

题目链接:HDU - 2896

病毒侵袭

当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋——我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦

Input

第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。
每个病毒都有一个编号,依此为1—N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。
每个网站都有一个编号,依此为1—M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。

Output

依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。

Sample Input

3
aaa
bbb
ccc
2
aaabbbccc
bbaacc

Sample Output

web 1: 1 2 3
total: 1

题意

n个模式串,是病毒的特征码,特征码各不相同。
m个主串,是网站的内容,问你这个网站包括多少病毒,也就是内容能匹配上几个模式串,匹配了哪几个模式串。

我的理解

串的长度不大,但是也不小,肯定用暴力做kmp是不可以的,我们上AC自动机。
对于每个主串,我们用AC自动机做一次匹配,我们将match函数稍微一改,返回值不是一个串的数量,而是存到一个vector中去,完成一次匹配之后,我们将vector中的病毒编号排序,保存一下,最后打印出来。

这个题我一开始认为是一个板子题的改版,就大意了。有好几个很大的坑。
1.题目中说以上字符串中字符都是ASCII码可见字符(不包括回车),如果默认只有字母,对不起,RE。
2.web的输出末尾不得有空格,total的行末加回车,没注意到,对不起,PE。
3.要求web后的病毒编号由大到小排序,如果你没注意到,对不起,WA。

代码

#include <bits/stdc++.h>
using namespace std;
const int maxn = 10010;
const int maxt = 58010;

vector<int> tmp;

struct  Aho_Corasick{
	struct Trie
	{
		int next[130];
		int fail,cnt;
	}trie[maxt];

	int size;
	queue<int> q;

	void init(){
		while(q.size())	q.pop();
		size = 1;
		for(int i = 0;i<maxt;i++){
			memset(trie[i].next,0,sizeof(trie[i].next));
			trie[i].fail = trie[i].cnt = 0;
		}
	}

	void insert(char *s,int no){
		int len = strlen(s);
		int now = 0;
		for(int i = 0;i<len;i++){
			int id = s[i];
			if(trie[now].next[id]){
				now = trie[now].next[id];
			}else{
				trie[now].next[id] = size++;
				now = trie[now].next[id];
			}
		}
		trie[now].cnt = no;
	}

	void build(){
		trie[0].fail = -1;
		q.push(0);
		while(q.size()){
			int u = q.front();
			q.pop();
			for(int i = 0;i<130;i++){
				if(trie[u].next[i]){
					if(u==0)	trie[trie[u].next[i]].fail = 0;
					else{
						int v = trie[u].fail;
						while(v!=-1){
							if(trie[v].next[i]){
								trie[trie[u].next[i]].fail = trie[v].next[i];
								break;
							}
							v = trie[v].fail;
						}
						if(v == -1){
							trie[trie[u].next[i]].fail = 0;
						}
					}
					q.push(trie[u].next[i]);
				}
			}
		}
	}

	int Get(int u){
		int res = 0;
		while(u){
			res += trie[u].cnt;
			trie[u].cnt = 0;
			u = trie[u].fail;
		}
		return res;
	}

	void match(char *s){
		tmp.clear();
		int res = 0,now = 0;
		int len = strlen(s);
		for(int i = 0;i<len;i++){
			int id = s[i];
			if(trie[now].next[id]){
				now = trie[now].next[id];
			}else{
				int p = now;
				while(p!=-1 && trie[p].next[id] == 0){
					p = trie[p].fail;
				}
				if(p == -1){
					now = 0;
				}else{
					now = trie[p].next[id];
				}
			}
			if(trie[now].cnt){
				tmp.push_back(trie[now].cnt);
			}
		}
	}
}aho;

int n,m;
char s[maxn];
vector<int> ve[1010];

int main(){
	scanf("%d",&n);
	aho.init();
	for(int i = 1;i<=n;i++){
		scanf("%s",s);
		aho.insert(s,i);
	}
	aho.build();
	scanf("%d",&m);
	for(int i = 1;i<=m;i++){
		scanf("%s",s);
		aho.match(s);
		sort(tmp.begin(),tmp.end());
		ve[i] = tmp;
	}
	int tot = 0;
	for(int i = 1;i<=m;i++){
		if(ve[i].size()){
			tot++;
			printf("web %d:",i);
			for(int j = 0;j<ve[i].size();j++){
				printf(" %d",ve[i][j]);
			}
			putchar('\n');
		}
	}
	printf("total: %d\n",tot);

	return 0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值