算法介绍
- 在KMP 算法当中,我们的模式串只能有一个
- 如果我们想要对多个模式串进行匹配的话,除了一个个枚举匹配之外,我们希望有更高效的算法来充分利用字符串间的联系,加速运算
- AC自动机建立在 trie 结构的基础之上,同样是通过从根节点到某个节点的路径来表示一个字符串
- 我们在 trie 中查询某个字符串是否存在时,一般是从根往下走一遍。 但当我们进行匹配(查询)的串比较长时,往往会发生失配的情况
- 一个很自然的想法是,在 trie 上每个节点处也维护一个 next 数组。 这样失配了之后我们就可以跳到深度最深的合法位置,从而继续进行匹配了
- 这个 trie 上的 next 数组就是 fail 指针
- 这个加了 fail 指针的 trie 就是 AC 自动机
Code
- 根节点为1
tot=fail[1]=fail[0]=1;//Attention
void insert(string s,int pos)
{
int len=s.size(),now=1;
for(int i=0;i<len;i++)
{
int ch=s[i]-'a';
if(tr[now][ch]==0)tr[now][ch]=++tot;
now=tr[now][ch];
}end[now]=pos;
}
void AC()
{
queue<int> q;
rep(i,0,25)
if(tr[1][i])q.push(tr[1][i]),fail[tr[1][i]]=1;
while(q.size()){
int x=q.front();q.pop();
rep(i,0,25)if(tr[x][i]){
int y=tr[x][i];
fail[y]=tr[fail[x]][i]? tr[fail[x]][i]:1;//Attention
q.push(y);
}else tr[x][i]=tr[fail[x]][i]? :1;//Attenton
}
}
int query(string s)
{
int len=s.size(),now=1;
for(int i=0;i<len;i++)
{
now=tr[now][s[i]-'a']? tr[now][s[i]-'a']:1;//Attenton
for(int t=now;t!=1;t=fail[t])
{
ans[end[t]].num++;
}
}
}
- 根节点为0
void insert(string s,int pos)
{
int len=s.size(),p=0;
for(int i=0;i<len;i++)
{
int ch=s[i]-'a';
if(tr[p][ch]==0)tr[p][ch]=++tot;
p=tr[p][ch];
}end[p]=pos;
}
void AC()
{
queue<int> q;
rep(i,0,26)
if(tr[0][i])q.push(tr[0][i]),fail[tr[0][i]]=0;
while(q.size()){
int u=q.front();q.pop();
rep(i,0,26)if(tr[u][i]){
int v=tr[u][i];
fail[v]=tr[fail[u]][i];
q.push(v);
}else tr[u][i]=tr[fail[u]][i];
}
}
int query(string s)
{
int len=s.size(),now=0;
for(int i=0;i<len;i++)
{
now=tr[now][s[i]-'a'];
for(int t=now;t;t=fail[t])
{
ans[end[t]].num++;
}
}
}