不懂什么叫目录标题的目录标题
- 后缀自动机的预备知识
- position end set (posend)详解
-
- 引理1 如果字符串a是字符串b的后缀 , 那么posend(b) $\sqsubseteq$ posend(a)
- 引理2 posend(s) 唯一 ,而arcposend( posend(s) ) 并不唯一
- 引理3 arcposend( set )所确定的字符串,是一些长度(字符串的长度)连续的字符串,并且长度短的是长度长的后缀。
- 引理4 当a,b不是后缀关系时,posend(a) != posend( b )
- 引理5 由引理1, 2 , 3 ,4 。可以将全集,通过是否是后缀关系,构造一个parent树。
- 引理6 由引理3可知,一的节点Node , 其父节点parent,有字符串长度min_node = max_parent + 1。
- 在线构造parent树
- 在线构造后缀自动机
后缀自动机的预备知识
在字符串算法中,有名叫后缀自动机的算法。它的主要功能有:识别任何一个子串,每个子串出现的次数。算法的逻辑思想很巧妙,在明白字母树后,还有posend(末尾位置)集合等新的知识。
position end set (posend)
一个字符串S , 和它的某个子串 。子串在S中会出现n次 ,取子串的最后(end)一个字符在S出现的位置(position)作为集合(set)的元素,这个集合就叫做posend(下面会详细介绍)。
比如,S = aababa , 子串=ba。那么posend(ba) = {4 ,6}(下标从1开始)。
dfa图
后缀自动机并不是一颗数,而是一个图,这里我简单介绍下dfa图。
图1
- 边表示字母。
- 点表示状态,这个状态可以认为是否存在某个子串。
- 从initi出发,能走到某个点叫做accept。
position end set (posend)详解
后缀自动机中会通过position end set 的性质构造一个parent树,这颗树是整个后缀自动机的核心,也是难点。