题意:求哪些模式串在文本串里面出现的次数最多,输出次数和这些串。
分析:在ac自动机里面标记模式串的id,用map记录。
代码:
#include <iostream>
#include <cstdio>
#include <cstring>
#include <map>
#include <queue>
#include <string>
using namespace std;
const int maxn = 2e6+6;
const int kd = 26;
map <string,int> mp1;
map <int,string> mp2;
struct trie
{
int son[maxn][kd],endpos[maxn],fail[maxn];
int cnt,root;
int newnode()
{
endpos[cnt]=-1;
fill(son[cnt],son[cnt]+kd,-1);
return cnt++;
}
void Init()
{
cnt=0;
root=newnode();
}
void Insert(char str[],int id)
{
int index,i,now=root;
for(i=0;str[i];i++)
{
index=str[i]-'a';
if(son[now][index]==-1)
son[now][index]=newnode();
now=son[now][index];
}
endpos[now]=id;
}
void findfail()
{
queue <int > q;
fail[root]=root;
int i,j,index;
for(i=0;i<kd;i++)
{
if(son[root][i]==-1)
son[root][i]=root;
else
{
fail[son[root][i]]=root;
q.push(son[root][i]);
}
}
while(!q.empty())
{
int temp=q.front();
q.pop();
for(i=0;i<kd;i++)
{
if(son[temp][i]==-1)
son[temp][i]=son[fail[temp]][i];
else
{
fail[son[temp][i]]=son[fail[temp]][i];
q.push(son[temp][i]);
}
}
}
}
void Quert(char str[])
{
int index,i,now=root;
for(i=0;str[i];i++)
{
index=str[i]-'a';
now=son[now][index];
int temp=now;
while(temp!=root)
{
if(endpos[temp]!=-1)
++mp1[mp2[endpos[temp]]];
temp=fail[temp];
}
}
}
}ac;
char s[1000][1000],ss[1000006];
int main()
{
int n,i,j;
while(scanf("%d",&n)!=EOF && n!=0)
{
mp1.clear();
mp2.clear();
ac.Init();
for(i=1;i<=n;i++)
{
scanf("%s",s[i]);
ac.Insert(s[i],i);
mp2[i]=string(s[i]);
}
ac.findfail();
scanf("%s",ss);
ac.Quert(ss);
int maxx=0;
for(const auto &it:mp1)
if(it.second>maxx)
maxx=it.second;
printf("%d\n",maxx);
for(i=1;i<=n;i++)
if(mp1[s[i]]==maxx)
{
printf("%s\n",s[i]);
mp1.erase(mp1.find(s[i]));
}
}
return 0;
}