最近一直都在做字符串处理的问题,最近跟着kuangbin巨巨的链接做,特来加深下对自动机的理解。
题意:给n<=10000个长度不超过50的目标串和一个长度不超过1000000的模式串。
用模式串建立好自动机然后在模式串上搜索就好了
#include<stdio.h>
#include<iostream>
#include<algorithm>
#include<string.h>
#include<algorithm>
#include<queue>
using namespace std;
struct Tree
{
int next[500010][26],fail[500010],end[500010];
int root,L;
int newnode()
{
for(int i=0;i<26;i++)
next[L][i]=-1;
end[L++]=0;
return L-1;
}
void init()
{
L=0;
root=newnode();
}
void insert(char *s)
{
int len=strlen(s);
int p=root;
for(int i=0;i<len;i++)
{
int id=s[i]-'a';
if(next[p][id]==-1)
next[p][id]=newnode();
p=next[p][id];
}
end[p]++;
}
void build()
{
queue<int>q;
int p=root;
fail[root]=root;
for(int i=0;i<26;i++)
{
if(next[p][i]==-1)
next[p][i]=root;
else
{
fail[next[p][i]]=root;
q.push(next[p][i]);
}
}
while(!q.empty())
{
p=q.front();
q.pop();
for(int i=0;i<26;i++)
{
if(next[p][i]==-1)
{
next[p][i]=next[fail[p]][i];
}
else
{
fail[next[p][i]]=next[fail[p]][i];
q.push(next[p][i]);
}
}
}
}
int query(char *s)
{
int len=strlen(s);
int p=root;
int rt=0;
for(int i=0;i<len;i++)
{
int id=s[i]-'a';
p=next[p][id];
int temp=p;
while(temp!=root)
{
rt+=end[temp];
end[temp]=0;
temp=fail[temp];
}
}
return rt;
}
void debug()
{
for(int i = 0;i < L;i++)
{
printf("id = %3d,fail = %3d,end = %3d,chi = [",i,fail[i],end[i]);
for(int j = 0;j < 26;j++)
printf("%2d",next[i][j]);
printf("]\n");
}
}
};
char str[1000010];
Tree ac;
int main()
{
int n,T;
scanf("%d",&T);
while(T--)
{
scanf("%d",&n);
ac.init();
for(int i=0;i<n;i++)
{
scanf("%s",str);
ac.insert(str);
}
ac.build();
scanf("%s",str);
printf("%d\n",ac.query(str));
}
}