题目大意:
有 NN 个由小写字母组成的模式串以及一个文本串 TT 。每个模式串可能会在文本串中出现多次。你需要找出哪些模式串在文本串 TT 中出现的次数最多。
思路:
我真的醉,前面写简单版的时候把题目看错了,直接看成加强版的题面了….结果还错了简单版,因为简单版太简单就不放上来了。这题就是给每个模式串建一个ac自动机,然后每次跳fail跳到根,路径上的权值全部统计就好了。(很慢,超级慢,但是可以过)。思考后发现fail肯定是一颗树,而且fail每次跳的时候中间有些节点是没有贡献的,可以预处理一个g,表示fail的下一个有贡献的点在哪,每次跳g就好了(优化不多),前面说到fail是一个树,那么一个节点被匹配那么这棵树到根的所有节点的贡献都会加一,然后打标记从叶子节点往上走就可以线性做了。(懒,没打)
程序:
#include<cstdio>
#include<iostream>
#include<algorithm>
#include<cstring>
#include<queue>
#define N 1000005
std::queue<int>q;
char c[N][75],s[N];
bool h[N];
int n,ans[N],t[N][26],cnt,val[N],fail[N],ans1;
void ins(int x){
int len=strlen(c[x]),now=0;
for (int i=0;i<len;i++){
int u=c[x][i]-'a';
if (t[now][u]) now=t[now][u];
else now=t[now][u]=++cnt;
}
val[now]=x;
}
void getfail(){
while (!q.empty()) q.pop();
for (int i=0;i<26;i++)
if (t[0][i]) fail[t[0][i]]=0,q.push(t[0][i]);
while (!q.empty()){
int u=q.front();
q.pop();
for (int i=0;i<26;i++)
if (t[u][i]) fail[t[u][i]]=t[fail[u]][i],q.push(t[u][i]);
else t[u][i]=t[fail[u]][i];
}
}
void cheak(int x){
while (x){
if (val[x]) ans[val[x]]++;
x=fail[x];
}
}
int main(){
scanf("%d",&n);
while (n){
memset(ans,0,sizeof(ans));
memset(t,0,sizeof(t));
memset(val,0,sizeof(val));
memset(fail,0,sizeof(fail));
cnt=0;
for (int i=1;i<=n;i++){
scanf("%s",c[i]);
ins(i);
}
getfail();
scanf("%s",s);
int len=strlen(s);
int now=0;
for (int i=0;i<len;i++){
int u=s[i]-'a';
cheak(t[now][u]);
if (t[now][u]) now=t[now][u];
else now=t[fail[now]][u];
}
ans1=0;
for (int i=1;i<=n;i++) ans1=std::max(ans1,ans[i]);
printf("%d\n",ans1);
for (int i=1;i<=n;i++) if (ans1==ans[i]) printf("%s\n",c[i]);
scanf("%d",&n);
}
}