AC自动机,需要对 Trie 和 KMP 有一定的了解。
#include <cstdio>
#include <cstring>
#include <map>
#include <queue>
#include <iostream>
using namespace std;
const int TEXT_SIZE = 1000000 + 10;
const int SIGMA_SIZE = 26;
const int P_NUM = 150 + 10;
const int p_SIZE = 70 + 10;
const int MAXNODE = 20000;
map<string, int> ms;
struct AhoCorasickAutomata
{
int sz; //结点总数
int cnt[P_NUM];
int f[MAXNODE], last[MAXNODE], ch[MAXNODE][SIGMA_SIZE];
int val[MAXNODE];
int idx(char c) //字符 c 的编号
{
return c - 'a';
}
void Init() //初始化
{
sz = 1;
memset(ch[0], 0, sizeof(ch[0]));
memset(cnt, 0, sizeof(cnt));
ms.clear();
}
//插入字符串 s,附件信息为 v。注意 v 必须非0,因为0代表“本结点不是单词结点”
void Insert(char* s, int v)
{
int u = 0, n = strlen(s);
for (int i = 0; i < n; i++)
{
int c = idx(s[i]);
if (!ch[u][c]) //结点不存在
{
memset(ch[sz], 0, sizeof(ch[sz]));
val[sz] = 0; //中间结点的附加信息为0
ch[u][c] = sz++; //新建结点
}
u = ch[u][c]; //往下走
}
val[u] = v; //字符串的最后一个字符的附加信息为v
ms[string(s)] = v; //更新ms
}
//计算失配函数,方式和KMP很接近,只是将线性递归改成了按BFS顺序递推
void getFail()
{
queue<int> q;
f[0] = 0;
//初始号队列
for (int c = 0; c < SIGMA_SIZE; c++)
{
int u = ch[0][c];
if (u)
{
f[u] = 0;
q.push(u);
last[u] = 0;
}
}
//按BFS顺序计算失配函数
while (!q.empty())
{
int r = q.front();
q.pop();
for (int c = 0; c < SIGMA_SIZE; c++)
{
int u = ch[r][c];
if (!u) continue;
q.push(u);
int v = f[r];
while (v && !ch[v][c]) v = f[v];
f[u] = ch[v][c];
last[u] = val[f[u]] ? f[u] : last[f[u]];
}
}
}
void Find(char* T)
{
int n = strlen(T);
int j = 0; //当前结点编号,初始为根结点
for (int i = 0; i < n; i++) //文本串当前指针
{
int c = idx(T[i]);
while (j && !ch[j][c]) j = f[j]; //顺着失配边走,直到可以匹配
j = ch[j][c];
if (val[j]) print(j);
else if (last[j]) print(last[j]); //找到了
}
}
void print(int j)
{
if (j)
{
cnt[val[j]]++;
print(last[j]);
}
}
};
AhoCorasickAutomata ac;
char text[TEXT_SIZE], P[P_NUM][p_SIZE];
int n, T;
int main()
{
while (~scanf("%d", &n), n)
{
ac.Init(); //初始化
for (int i = 1; i <= n; i++)
{
scanf("%s", P[i]); //输入n个字符串(模板)
ac.Insert(P[i], i); //插入
}
ac.getFail(); //失配函数
scanf("%s", text); //输入文本串
ac.Find(text); //计算每个模板的 cnt 值
int best = -1;
for (int i = 1; i <= n; i++)
if (ac.cnt[i] > best) best = ac.cnt[i]; //更新最大值
printf("%d\n", best);
for (int i = 1; i <= n; i++)
if (ac.cnt[ms[string(P[i])]] == best) printf("%s\n", P[i]);
}
return 0;
}