后缀自动机的实现流程可以参考http://blog.csdn.net/u012061345/article/details/24205703或者其他资料,理论分析可以参考clj的论文。这里演示字符串ACADD的后缀自动机建立的完整过程。
0. 初始情况下,如图1所示。圆圈中的数值表示节点的step,也就是节点插入的顺序。
图0
1. 在0基础上,创建新节点,建立SAM("A")。符合情况1。其中虚线箭头代表pre指针(情况1、2、3的区分见上述链接)
图1
2. 在1基础上创建新节点,建立SAM("AC")。符合情况1。
图2
3. 建立SAM("ACA"),符合情况2。
图3
4. 建立SAM("ACAD"),符合情况1
图4
5. 建立SAM("ACADD"),符合情况3
图5
至此,字符串"ACADD"的后缀自动机建立完毕。其终态分别是0、1(下方的那个)、5,其可接受的字符串分别是ε、D、DD、ACADD、CADD和ADD,恰好是源串的全部后缀。
而能够运行到非终态的字符串包括A、AC、ACA、C、CA、CAD和AD,全部加起来恰好是源串的所有不同子串。