AC自动机总结
自动机的概念:
自动机又称有限状态自动机,是从初始状态不断接受输入,根据输入数据和当前状态跳转到下一状态的一种机器。
\(AC\)自动机可以实现多串匹配单串。复杂度是\(O(\sum n+m)\),也就是模式串总长+文本串长。
\(AC\)自动机匹配失配时,类似\(KMP\)算法的\(next\)数组,\(AC\)自动机上有\(fail\)指针可以跳到下一个应该进行匹配的状态。
\(fail\)指针的一般定义是:沿着父亲的\(fail\)指针一直向上跳,直到跳到某一个节点,这个节点拥有与自己相同字母的子节点,那么\(fail\)指针就指向这个相同字母的子节点。
一般写起来是这样的
void Get_Fail()
{
for (int i=0;i<26;i++) if (ch[i][0]) Q.push(ch[i][0]);
while (!Q.empty())
{
int u=Q.front();Q.pop();
for (int i=0;i<26;i++)
if (ch[i][u]) fail[ch[i][u]]=ch[i][fail[u]],Q.push(ch[i][u]);
else ch[i][u]=ch[i][fail[u]];
}
}
这样相当于建出了一个\(Trie\)图,使得每个节点都拥有了\(26\)个儿子。如果你想要保存原\(Trie\)树的话请先备份。
一般来说插入一个模式串就是
void Insert(string c,int ID)
{
int l=c.length(),x=0;
for (int i=0;i<l;i++)
{
if (!ch[c[i]-'a'][x]) ch[c[i]-'a'][x]=++tot;
x=ch[c[i]-'a'][x];
}
id[x]=ID;
}
然后因为\(AC\)自动机本身就和“状态”关系密切,所以\(AC\)自动机上往往会用来跑\(DP\)。
然后如果你不记得\(KMP\)怎么写了也可以写\(AC\)自动机。
几个小tips
如果是给出若干个串求匹配,由\(fail\)指针串起来的点是一个点,意思是如果你匹配了一个串,那么你同时也匹配了这个串的任意后缀。所以你在\(AC\)自动机上每走过一个点,就要暴跳\(fail\)到\(root\)进行匹配。
但如果是给出若干不合法串求合法方案数,这时由\(fail\)指针串起来的点就不是一个点,因为假使认为是同一个点会导致不合法状态计入。同时,不合法标记要沿着\(fail\)下传,意思是如果某一个串不合法,那么以这个串为前缀的任意串都不合法。