题目描述:
小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?
Input
第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。
Output
按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。
病毒特征码: 出现次数
冒号后有一个空格,按病毒特征码的输入顺序进行输出。
Sample Input
3
AA
BB
CC
ooxxCC%dAAAoen…END
Sample Output
AA: 2
CC: 1
Hint
Hit:
题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。
计数策略也可一定程度上从Sample中推测。
题解:AC自动机模板,我们把每个病毒尾结点用num数组存起来,统计的时候把所有尾结点经过的次数++(用ans1数组) 直接输出ans1【 num【i】 】
毒瘤:
1.多组输入
2.数据范围 ans1我开的50050(50*1000) 这样过不了,必须开大才行…wa了都不知道错哪了…
#include<iostream>
#include<algorithm>
#include<string>
#include<queue>
#include<cstdio>
using namespace std;
const int maxn=3e6+10;
int trie[maxn][30];
int cntword[maxn]; //统计是不是单词尾部 ,统计次数
int fail[maxn];
int num[maxn],ans1[maxn]; //失配时所指向的节点
int tot=0,ch;
string str;
string s[1050];
void insert(string str,int k) //字典树模板 O(单词长度)
{
int p=0,m=str.size(); //strlen写外面 否则超时 strlen时间复杂度O(n)
for(int i=0;i<m;i++)
{
ch=str[i]-'A';
if(!trie[p][ch]) trie[p][ch]=++tot; //tot是最大节点
p=trie[p][ch];
}
num[k]=p;
cntword[p]=1; //标记出现的次数
}
void getfail() //o(节点个数(所有单词的个数))
{
queue<int> q;
for(int i=0;i<26;i++) //将第一层的节点入队 ,并且fail指针都指向root
{
if(trie[0][i])
{
fail[trie[0][i]]=0;
q.push(trie[0][i]);
}
}
while(!q.empty()) //bfs求所有节点的fail值
{
int now=q.front();
q.pop();
for(int i=0;i<26;i++)
{
if(trie[now][i])
{
fail[trie[now][i]]=trie[fail[now]][i];//now子节点的fail指针指向now的fail值的子节点
q.push(trie[now][i]); //now子节点入队
}
else //当匹配到字典树的最后一个子节点后,trie值指向now节点fail的子节点,利于继续往下匹配。
{
trie[now][i]=trie[fail[now]][i];//now的子节点的trie值等于now的fail值的子节点,
}
}
}
}
void query(string str) //查找text文本中出现的单词 O (文本串长度)
{
int ans=0,now=0,m=str.size(); //strlen写外面,or TLE
for(int i=0;i<m;i++) //遍历文本串
{
if(str[i]-'A'<0||str[i]-'A'>25)
now=0;
else
now=trie[now][str[i]-'A'];
for(int j=now; j &&cntword[j]!=-1;j=fail[j]) //如果到了叶子节点,叶子结点fail指针指向的节点所有的路径
{ //的最长前缀==叶子结点的最长后缀并且最长前缀是一个完整单词,统计到ans中
//ans+=cntword[j];
if(cntword[j]) ans1[j]++; //这样避免的遗漏。
//cntword[j]=-1; //统计过不能统计,避免重复。
}
}
}
int main()
{
ios::sync_with_stdio(false);
int n;
while(cin>>n)
{ int k;
for(int i=1;i<=n;i++)
{
cin>>s[i];
k=i;
insert(s[i],k);
}
getfail();
cin>>str;
query(str);
for(int i=1;i<=n;i++)
{
if(ans1[num[i]])
cout<<s[i]<<": "<<ans1[num[i]]<<endl;
}
for(int i=0;i<tot;i++)
{
num[i]=0;
ans1[i]=0;
for(int j=0;j<26;j++)
trie[i][j]=0;
cntword[i]=0;
fail[i]=0;
}
}
return 0;
}