当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋――我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~
Input
第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20―200之间。
每个病毒都有一个编号,依此为1―N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000―10000之间。
每个网站都有一个编号,依此为1―M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。
Output
依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。
Sample Input
3 aaa bbb ccc 2 aaabbbccc bbaacc
Sample Output
web 1: 1 2 3 total: 1
题意: 有n个模式串,m个文本串,对于每个文本串,输出所有出现的模式串编号,如果没有出现就跳过。最后输出有几个文本串中出现了模式串。
分析: 坑挺多的!题目中说输入字符都是ascii码可见字符,因此可能出现空格,这样就没法用scanf或cin读入字符串了,需要用gets或getline读入字符串。另外trie插入字符串时要遍历0~128,同时不需要减去'a'了,要克服思维惯性。输出模式串编号需要升序输出,还得先排个序。最后输出total时要末尾换行,否则会PE!
具体代码如下:
#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#include <queue>
#include <vector>
using namespace std;
struct node
{
int son[128];
int cnt;//当前单词出现次数
int fail;//失配指针
}trie[100010];
char word[205], text[10010];
int idx;
vector<int> ans;
bool vis[100010];//表示关键词是否出现过
void insert(int id)
{
int now = 0, len = strlen(word);
for(int i = 0; i < len; i++)
{
int t = word[i];
if(!trie[now].son[t])
trie[now].son[t] = ++idx;
now = trie[now].son[t];
}
trie[now].cnt = id;
}
void GetFail()//bfs的过程
{
queue<int> q;
for(int i = 0; i < 128; i++)
if(trie[0].son[i])
q.push(trie[0].son[i]);
while(!q.empty())
{
int now = q.front();
q.pop();
for(int i = 0; i < 128; i++)
{
int to = trie[now].son[i], fafail = trie[now].fail;
if(to)
{
trie[to].fail = trie[fafail].son[i];//由于是个递归,这样写没问题
q.push(to);
}
else//其实是个递归的思想
trie[now].son[i] = trie[fafail].son[i];//简化[查找时先到fail处,再到fail的son处]
}
}
}
void query()
{
int now = 0, len = strlen(text);
for(int i = 0; i < len; i++)//遍历文本串
{
now = trie[now].son[text[i]];//直接到达下一步要到的点,跳过了先走fail的步骤
for(int j = now; j && !vis[j]; j = trie[j].fail)
{
if(trie[j].cnt != 0)
ans.push_back(trie[j].cnt);
vis[j] = true;
}
}
}
signed main()
{
int n, m;
cin >> n;
getchar();
for(int i = 1; i <= n; i++)
{
gets(word);
insert(i);
}
GetFail();//获取失配指针
cin >> m;
getchar();
int t = 0;
for(int i = 1; i <= m; i++)
{
ans.clear();
gets(text);
memset(vis, false, sizeof vis);
query();
if(!ans.empty())
{
t++;
printf("web %d:", i);
sort(ans.begin(), ans.end());
for(int i = 0; i < ans.size(); i++)
printf(" %d", ans[i]);
puts("");
}
}
printf("total: %d\n", t);
return 0;
}