HDU3065
题意就是给你一些病毒网站关键字,统计每个关键字的出现次数,可重叠。
我们用病毒网站关键字搭建好AC自动机,用文本串在上面跑,由于每个Fail递归的过程是必包含当前后缀的(仔细思考),所以是不会出现重复统计的情况的,所以我们只需要在递归的时候对每个关键字计数,最后输出就可以了。
注意:多组输入,ASCII码可见字符有128种
HDU3065代码
#include<stdio.h>
#include<algorithm>
#include<iostream>
#include<string.h>
#include<queue>
using namespace std;
const int maxn = 5e5+5;
struct ACTrie
{
int tree[maxn][128],fail[maxn],end_[maxn],sum[maxn];//用end_数组存储该单词的下标,sum统计出现次数
int root,cnt,num;
int newnode()
{
for(int i=0;i<128;i++)
tree[cnt][i]=-1;
end_[cnt]=0;
return cnt++;
}
void init()
{
cnt=0;
num=0;
root=newnode();
return ;
}
void insert_(char str[])
{
int len=strlen(str);
int pos=root;
for(int i=0;i<len;i++)
{
int id=str[i];
if(tree[pos][id]==-1) tree[pos][id]=newnode();
pos=tree[pos][id];
}
end_[pos]=++num;//用时间戳记录下标
sum[num]=0;
return ;
}
void build()
{
queue<int> que;
fail[root]=root;
for(int i=0;i<128;i++)
{
if(tree[root][i]==-1) tree[root][i]=root;
else
{
fail[tree[root][i]]=root;
que.push(tree[root][i]);
}
}
while(!que.empty())
{
int now=que.front();
que.pop();
for(int i=0;i<128;i++)
{
if(tree[now][i]==-1) tree[now][i]=tree[fail[now]][i];
else
{
fail[tree[now][i]]=tree[fail[now]][i];
que.push(tree[now][i]);
}
}
}
return ;
}
void query(char str[])
{
int len=strlen(str);
int now=root;
for(int i=0;i<len;i++)
{
now=tree[now][str[i]];
int tmp=now;
while(tmp!=root)
{
if(end_[tmp]) sum[end_[tmp]]++;//统计答案
tmp=fail[tmp];
}
}
return ;
}
};
char str[1005][55];
ACTrie ac;
char str0[2000005];
int main()
{
int n;
while(scanf("%d",&n)!=EOF)
{
ac.init();
for(int i=1;i<=n;i++)
{
scanf("%s",str[i]);
ac.insert_(str[i]);
}
ac.build();
scanf("%s",str0);
ac.query(str0);
for(int i=1;i<=ac.num;i++)
{
if(ac.sum[i]!=0)
printf("%s: %d\n",str[i],ac.sum[i]);
}
}
return 0;
}