做的第一道AC自动机专题的题目。。。
题意:给你一堆单词和一个文本串,求出文本串中出现次数最多的单词。
思路:AC自动机。这道题是AC自动机的基本应用。建立一个AC自动机,用val[u]=1表示节点u处为一个单词的尾节点,否则val[u]=0。然后用文本串去匹配,每经过一个val[u]=1的点就把计数数组cnt[i]++;(i为第i个单词),最后找cnt中值最大的,然后再遍历一遍cnt数组,值等于最大值就输出该单词。(因为出现次数最多的可能不止一个单词)
注意:输入的单词可能有重复的情况。如果一个单词输入了两遍,那么第二次输入这个单词时就会覆盖第一次输入的这个单词,导致第一次输入的这个单词对应的cnt最终为0。然而如果这个单词出现次数最多我们是要输出两遍的。因此我们再建立一个map映射,不管一个单词输入了几遍,我们都把它映射到这个单词最后一次输入的位置的编号,然后输出的时候直接找每个单词map对应的位置的编号,只要cnt[该单词的编号]==最大值 就输出。具体见代码。
AC代码:
#include<iostream>
#include<cmath>
#include<cstring>
#include<algorithm>
#include<cstdio>
#include<string>
#include<queue>
#include<vector>
#include<map>
#include<set>
using namespace std;
const int mo=1e9+7;
const int mx=10010;
const int ssize=26;
const int inf=0x3f3f3f3f;
map<string,int> mp;
struct ACzdj{
int ch[mx][ssize];
int val[mx];
int f[mx];
int last[mx];
int sz;
int cnt[200];
void init(){
memset(ch[0],0,sizeof(ch[0]));
sz=1;
val[0]=0;
mp.clear();
memset(cnt,0,sizeof(cnt));
}
void insert(char *s,int v)
{
int u=0,n=strlen(s);
for(int i=0;i<n;i++)
{
int id=s[i]-'a';
if(ch[u][id]==0)
{
ch[u][id]=sz;
memset(ch[sz],0,sizeof(ch[sz]));
val[sz++]=0;
}
u=ch[u][id];
}
val[u]=v;
mp[string(s)]=v;//直接把该单词映射到一个编号,这样不管输入几遍每个单词都只对应一个编号
}
void print(int i)
{
if(val[i])
{
cnt[val[i]]++;
print(last[i]);
}
}
void find(char *s)
{
int n=strlen(s),j=0;
for(int i=0;i<n;i++)
{
int id=s[i]-'a';
while(j&&ch[j][id]==0) j=f[j];
j=ch[j][id];
if(val[j]) print(j);
else if(val[last[j]]) print(last[j]);
}
}
void getFail()
{
queue<int> q;
last[0]=f[0]=0;
for(int i=0;i<ssize;i++)
{
int u=ch[0][i];
if(u){
f[u]=last[u]=0;
q.push(u);
}
}
while(!q.empty())
{
int r=q.front();q.pop();
for(int i=0;i<ssize;i++)
{
int u=ch[r][i];
if(!u) continue;
q.push(u);
int v=f[r];
while(v&&ch[v][i]==0) v=f[v];
f[u]=ch[v][i];
last[u]=val[f[u]]?f[u]:last[f[u]];
}
}
}
};
ACzdj ac;
char word[160][80];
char t[1000100];
int main()
{
int n;
while(scanf("%d",&n)==1&&n)
{
ac.init();
for(int i=1;i<=n;i++)
{
scanf("%s",word[i]);
ac.insert(word[i],i);
}
ac.getFail();
scanf("%s",t);
ac.find(t);
int maxnum=-1;
for(int i=1;i<=n;i++)
{
if(ac.cnt[i]>maxnum)
{
maxnum=ac.cnt[i];//找出出现次数最多的单词出现的次数
}
}
printf("%d\n",maxnum);
for(int i=1;i<=n;i++)
if(ac.cnt[mp[string(word[i])]]==maxnum)//通过mp来获得单词唯一对应的编号,这样就不怕重复输入了
printf("%s\n",word[i]);
}
return 0;
}