做了一些关于后缀自动机的题,写一下自己的一点理解吧
在开始看后缀自动机之前建议看一下后缀树,这样在做题的时候比较好想一点,感觉后缀树比自动机直观一点
后缀树的链接http://blog.163.com/ps_lm/blog/static/20790406120125883433110/
后缀自动机http://fanhq666.blog.163.com/blog/static/8194342620123352232937/
baaba
我们往后缀树上依次添加串a,ba,aba,aaba,baaba这样构造出来的
后缀自动机上的后缀就相当于构造出来的后缀树的逆序
下面有abaaaba的图来做例子(我自己做的图太丑了… 好看的是从别人那里弄得http://roosephu.blog.163.com/blog/static/2037060302012399282476/
后缀树(这棵树的父亲指针就是SAM的父亲指针
下边这个是后缀树的trans指针
后缀树的trans指针就是SAM的son指针
然后是SAM的son指针
SAM的fa指针
从上边就可以把后缀树和后缀自动机联系起来
后缀树的fa=SAM的fa
后缀树的trans=SAM的son
后缀自动机里的fa指针作用就是比如说我们现在有三个状态节点
1.abaab
2.baab
3.ab
这里我们的fa指针就是1->fa=2,2->fa=3
fa指针只跳到与当前状态后缀匹配长度最长的节点,可以通过一直跳fa来找到想找到匹配后缀
假设当前节点的len==6,当前节点的pre节点len==2
这个节点接收的状态就是以当前节点为最后一个字符的后缀的长度是3~6里
比如当前节点的最长后缀是abcabb(sam.len==6),pre节点是b(sam.len==2)
那么当前节点的接收子串是abcabb,bcabb,cabb,abb
pre节点接收的状态就是bb,b
所以当前节点的状态包含pre节点
我们经常在题目中遇到一个简单的问题,就是问B串在A串中出现了几次
很明显,我们如果B串包括abaab就是1,那baab和ab也被包括了,我们只需要mark上1就行了,最后通过topsort后的顺序来跳fa指针来统计2,3状态出现的次数
len
因为一个SAM的节点会接受很多节点,所以我们无法确定走到当前结点的长度是多少,但是len是所有接受状态中最长的那个的长度
SAM中添加x节点有两中方式
1.sam[p].len+1==sam[sam[p].son[x]].len
这个就等于在后缀树上比如说aab
添加a后,我们要添加一个aa,我们只需要把新添节点放到添加a节点的儿子里就行了,这里的儿子并不是SAM的儿子,然后trans[(a的接受节点)][a]=当前结点就行了
2.sam[p].len+1 < sam[sam[p].son[x]].len
就相当于在后缀树上的abb串
先添加b节点,然后添加下一个b节点的时候发现当前这个b节点还是接受状态,这时候我们就在后缀自动机上新建一个节点来表示这个节点,所以后缀树上的节点数不一定等于后缀自动机上的节点数
听说后缀自动机能解决后缀树和后缀数组的一切问题,真是太神了ORZ,就不用纠结于DC3和倍增什么的了,但是如果是又数字组成的字符串而且数字很大的话就要用后缀数组了