HDU 3065 病毒侵袭持续中(AC自动机)
http://acm.hdu.edu.cn/showproblem.php?pid=3065
题意:
给你多个不同的模板和一个文本串.问你这个文本串中各个模板都分别出现了多少次?
分析:
由于模板不同,所以直接建立AC自动机.val表示单词节点的编号.
当用文本T匹配AC自动机的时候,发现一个单词节点i就把对应的cnt[val[i]]++即可.最后按顺序输出即可.
AC代码:
#include<queue>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cmath>
using namespace std;
const int maxnode=50000+100;
const int sigma_size=128;
int cnt[1000+10];
struct AC_Automata
{
int ch[maxnode][sigma_size];
int val[maxnode];//表示单词节点的编号,从1开始计数
int f[maxnode];
int last[maxnode];
int sz;
void init()
{
sz=1;
memset(ch[0],0,sizeof(ch[0]));
val[0]=f[0]=last[0]=0;
}
void insert(char *s,int v)
{
int n=strlen(s),u=0;
for(int i=0;i<n;i++)
{
int id=s[i];
if(ch[u][id]==0)
{
ch[u][id]=sz;
memset(ch[sz],0,sizeof(ch[sz]));
val[sz++]=0;
}
u=ch[u][id];
}
val[u]=v;
}
void print(int i)
{
if(val[i])
{
cnt[val[i]]++;
print(last[i]);
}
}
void find(char *s)
{
int n=strlen(s),j=0;
for(int i=0;i<n;i++)
{
int id=s[i];
while(j && ch[j][id]==0) j=f[j];
j=ch[j][id];
if(val[j]) print(j);
else if(last[j]) print(last[j]);
}
}
void getFail()
{
queue<int> q;
f[0]=0;
for(int i=0;i<sigma_size;i++)
{
int u=ch[0][i];
if(u)
{
last[u]=f[u]=0;
q.push(u);
}
}
while(!q.empty())
{
int r=q.front();q.pop();
for(int i=0;i<sigma_size;i++)
{
int u=ch[r][i];
if(!u) continue;
q.push(u);
int v=f[r];
while(v && ch[v][i]==0) v=f[v];
f[u]=ch[v][i];
last[u]= val[f[u]]?f[u]:last[f[u]];
}
}
}
};
AC_Automata ac;
char word[1000+10][50+10];
char text[2000000+10];
int main()
{
int n;
while(scanf("%d",&n)==1&&n)
{
ac.init();
memset(cnt,0,sizeof(cnt));
for(int i=1;i<=n;i++)
{
scanf("%s",word[i]);
ac.insert(word[i],i);
}
ac.getFail();
scanf("%s",text);
ac.find(text);
for(int i=1;i<=n;i++)
{
if(cnt[i])
printf("%s: %d\n",word[i],cnt[i]);
}
}
return 0;
}