传送门:Keywords Search
题目大意:这道题是AC自动机的模板题。题目很简单,第一个数是测试样例个数。每个样例先给一个n,接下来有n个字符串,再给一个母串,问这些字符串中有多少个在母串中出现过。
分析:此题中母串长度很长,能达到1000000,所以KMP是注定TML的,果断AC自动机。陷阱就是在n个字符串中有可能有相同字符串出现。这是很多人WA的原因。对了,这道题由于内存限制,字典树的节点开不了50W个,经测试25W可A。当然最好用指针动态申请空间要好一些。
不多说了,放代码:
#include <cstring>
#include <cstdio>
#include <queue>
using namespace std;
int t;
int n;
char ss[1100000];
int next[260010][26]; //指向下一个节点
int c[260010]; //记录以此结点结尾的单词个数
int fail[260010]; //失败指针
int num;
void insert(char s[]) //字典树中插入单词
{
int t = 1;
int len = strlen(s);
for (int i=0;i<len ;i++ )
{
if(next[t][s[i]-'a']==0)
next[t][s[i]-'a'] = num++;
t = next[t][s[i]-'a'];
}
c[t]++;
}
void makeAC() //建立字典树,构造失败指针
{
queue<int> q;
q.push(1);
int t,tt;
while(!q.empty())
{
t = q.front();
q.pop();
for (int i=0;i<26 ;i++ )
{
if(next[t][i])
{
tt = fail[t];
while(tt)
{
if(next[tt][i])
{
fail[next[t][i]] = next[tt][i];
break;
}
tt = fail[tt];
}
if(tt == 0)
fail[next[t][i]] = 1;
q.push(next[t][i]);
}
}
}
}
int count(char s[]) //计数
{
int tt;
int n = 0,t = 1;
int len = strlen(s);
for (int i=0;i<len ;i++ )
{
if(next[t][s[i]-'a'])
t = next[t][s[i]-'a'];
else
{
while(t!=1 && next[t][s[i]-'a']==0)
t = fail[t];
if(t!=1 || next[t][s[i]-'a'])
t = next[t][s[i]-'a'];
}
tt = t;
while(tt!=1 && c[tt]!=-1) //顺着失败指针访问所有已i结尾的单词,记录单词个数
{
n += c[tt];
c[tt] = -1; //标记节点已被访问,不再访问
tt = fail[tt];
}
}
return n;
}
int main()
{
scanf("%d",&t);
char s[111];
for (int i=0;i<t ;i++ )
{
num = 2;
memset(next,0,sizeof(next));
memset(c,0,sizeof(c));
memset(fail,0,sizeof(fail));
scanf("%d",&n);
for (int j=0;j<n ;j++ )
{
scanf("%s",s);
insert(s);
}
makeAC();
scanf("%s",ss);
printf("%d\n",count(ss));
}
return 0;
}
由于本人现在对AC自动机的了解还很肤浅,在这里就不介绍AC自动机了,有兴趣的同学可自行百度。等在做几道难点的AC自动机题再写个专栏,重点讲解一下。