Description
小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?
Input
第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1―50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1―50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。
Output
按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。
病毒特征码: 出现次数
冒号后有一个空格,按病毒特征码的输入顺序进行输出。
病毒特征码: 出现次数
冒号后有一个空格,按病毒特征码的输入顺序进行输出。
Sample Input
3 AA BB CC ooxxCC%dAAAoen....END
Sample Output
AA: 2 CC: 1
Hint
Hit: 题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。 计数策略也可一定程度上从Sample中推测。
注意字符串范围只为大写字母!另外每次匹配失败后要从根节点重新匹配!
#include <iostream>
#include <algorithm>
#include <stdio.h>
#include <string.h>
#include <string>
using namespace std;
#define kind 26
#define N 1005
#define M 2000005
int head, tail;
char keyword[N][55],str[M];
int k[N];
struct node
{
node *fail;
node *next[kind];
int id,count;
node() //init
{
fail = NULL;
count=0;
id=0;
for(int i = 0; i <kind; ++i)
next[i] = NULL;
}
}*q[500000];
node *root;
void insert(char *str,int num) //建立Trie
{
int temp, len;
node *p = root;
len = strlen(str);
for(int i = 0; i < len; ++i)
{
temp = str[i] - 'A';//注意:字符串只包含“英文大写字符”
if(p->next[temp] == NULL)
p->next[temp] = new node();
p = p->next[temp];
}
p->id=num;
p->count++;
}
void build_ac() //初始化fail指针,BFS
{
q[tail++] = root;
while(head != tail)
{
node *p = q[head++]; //弹出队头
node *temp = NULL;
for(int i = 0; i < kind; ++i)
{
if(p->next[i] != NULL)
{
if(p == root) //第一个元素fail必指向根
p->next[i]->fail = root;
else
{
temp = p->fail; //失败指针
while(temp != NULL) //2种情况结束:匹配为空or找到匹配
{
if(temp->next[i] != NULL) //找到匹配
{
p->next[i]->fail = temp->next[i];
break;
}
temp = temp->fail;
}
if(temp == NULL) //为空则从头匹配
p->next[i]->fail = root;
}
q[tail++] = p->next[i]; //入队
}
}
}
}
void query(char *str) //扫描
{
int index,len;
node *p = root; //Tire入口
len = strlen(str);
for(int i = 0; i < len; ++i)
{
if(str[i]>='A'&&str[i]<='Z')
{
index = str[i]-'A';//注意:字符串只包含“英文大写字符”
while(p->next[index] == NULL && p != root) //跳转失败指针
p = p->fail;
p = p->next[index];
if(p == NULL)
p = root;
node *temp = p; //p不动,temp计算后缀串
while(temp != root&&temp->count>0)
{
k[temp->id]++;
temp = temp->fail;
}
}
else p=root;//不满足则从头开始!!
}
}
int main()
{
int n;
while(scanf("%d",&n)!=EOF)
{
head= tail = 0;
root = new node();
memset(k,0,sizeof(k));
for(int i=1; i<=n; i++)
{
scanf("%s",keyword[i]);
insert(keyword[i],i);
}
build_ac();
scanf("%s", str);
query(str);
for(int i=1; i<=n; i++)
{
if(k[i]>0)
printf("%s: %d\n",keyword[i],k[i]);
}
}
return 0;
}