题目描述
有 NN 个由小写字母组成的模式串以及一个文本串 TT。每个模式串可能会在文本串中出现多次。你需要找出哪些模式串在文本串 TT 中出现的次数最多。
输入格式
输入含多组数据。保证输入数据不超过 5050 组。
每组数据的第一行为一个正整数 NN,表示共有 NN 个模式串,1 \leq N \leq 1501≤N≤150。
接下去 NN 行,每行一个长度小于等于 7070 的模式串。下一行是一个长度小于等于 10^610
6
的文本串 TT。保证不存在两个相同的模式串。
输入结束标志为 N=0N=0。
输出格式
对于每组数据,第一行输出模式串最多出现的次数,接下去若干行每行输出一个出现次数最多的模式串,按输入顺序排列。
输入输出样例
输入 #1 复制
2
aba
bab
ababababac
6
beta
alpha
haha
delta
dede
tata
dedeltalphahahahototatalpha
0
输出 #1 复制
4
aba
2
alpha
haha
分析:
记录每个模式串最后一个字母在tire树上的编号,遍历文本串,找到出现最多次的模式串。
#include<bits/stdc++.h>
#define ll long long
using namespace std;
const int N = 75,M = 155,E=N*M,S=1e6+10;
char st[M][N],dd[S];
int cnt[E],tr[E][26],ne[E],q[E],idx,f[M];
void insert(int t)
{
int p=0;
int m=strlen(st[t]);
for(int i=0;i<m;i++)
{
int x=st[t][i]-'a';
if(!tr[p][x]) tr[p][x]=++idx;
p=tr[p][x];
}
f[t]=p;
}
void build()
{
int hh=0,tt=-1;
for(int i=0;i<26;i++)
{
if(tr[0][i]) q[++tt]=tr[0][i];
}
while(hh<=tt)
{
int t=q[hh++];
for(int i=0;i<26;i++)
{
int p=tr[t][i];
if(!p) tr[t][i]=tr[ne[t]][i];
else
{
ne[p]=tr[ne[t]][i];
q[++tt]=p;
}
}
}
}
int main()
{
int n;
while(scanf("%d",&n))
{
if(n==0) break;
memset(tr,0,sizeof(tr));
memset(cnt,0,sizeof(cnt));
memset(ne,0,sizeof(ne));
memset(f,0,sizeof(f));
idx=0;
for(int i=1;i<=n;i++)
{
scanf("%s",st[i]);
insert(i);
}
build();
scanf("%s",dd);
int m=strlen(dd);
int j=0;
for(int i=0;i<m;i++)
{
int t=dd[i]-'a';
j=tr[j][t];
int p=j;
while(p)
{
cnt[p]++;
p=ne[p];
}
}
int mx=-1;
for(int i=1;i<=n;i++)
{
if(cnt[f[i]]>mx)
{
mx=cnt[f[i]];
}
}
printf("%d\n",mx);
for(int i=1;i<=n;i++)
{
if(cnt[f[i]]==mx)
{
printf("%s\n",st[i]);
}
}
}
return 0;
}