后缀自动机的理解

后缀自动机是一种用于字符串算法的工具,主要用于识别子串及其出现次数。本文介绍了后缀自动机的预备知识,包括position end set (posend)的概念,并详细解释了与后缀关系相关的五个引理,通过这些引理构造parent树。此外,文章还概述了在线构造parent树和后缀自动机的过程。
摘要由CSDN通过智能技术生成

后缀自动机的预备知识

      在字符串算法中,有名叫后缀自动机的算法。它的主要功能有:识别任何一个子串,每个子串出现的次数。算法的逻辑思想很巧妙,在明白字母树后,还有posend(末尾位置)集合等新的知识。

position end set (posend)

      一个字符串S , 和它的某个子串 。子串在S中会出现n次 ,取子串的最后(end)一个字符在S出现的位置(position)作为集合(set)的元素,这个集合就叫做posend(下面会详细介绍)。

      比如,S = aababa , 子串=ba。那么posend(ba) = {4 ,6}(下标从1开始)。

dfa图

      后缀自动机并不是一颗数,而是一个图,这里我简单介绍下dfa图。
dfa
图1

  1. 边表示字母。
  2. 点表示状态,这个状态可以认为是否存在某个子串。
  3. 从initi出发,能走到某个点叫做accept。

position end set (posend)详解

      后缀自动机中会通过position end set 的性质构造一个parent树,这颗树是整个后缀自动机的核心,也是难点。

引理1 如果字符串a是字符串b的后缀 , 那么posend(b) ⊑ \sqsubseteq posend(a)

例子:aababa

  • posend(“a”) = {1 , 2 , 4 , 6}
  • posend(“ba”) = {4 , 6}
  • posend(“ba”) = {4 , 6} ⊑ \sqsubseteq posend(a)
  • 证毕。手动滑稽
    这个引理应该很好想,“ba”出现的位置 “a”一定出现的了,而“a”出现的位置“ba”不一定出现。

图解
在这里插入图片描述
图2

引理2 posend(s) 唯一 ,而arcposend( posend(s) ) 并不唯一

例子:aababa

  • posend(“ab”) = {3 , 5}
  • posend(“b”) = {3 , 5}
  • posend(“ab”) = posend(“b”);
  • 证毕。手动滑稽
    这个引理实在不知道怎么解释。如图2, b ,a只在这些位置出现那么posend(a) = posend(a)

引理3 arcposend( set )所确定的字符串,是一些长度(字符串的长度)连续的字符串,并且长度短的是长度长的后缀。

例子:aababa

  • acrposend({3 , 5}) = “ab” , “b”.
  • "b"是“ab”的后缀串
  • acrposend({4 , 6}) = “aba” , “ba”.
  • "ba"是“aba”的后缀串
  • 证毕。手动滑稽

一些长度(字符串的长度)连续的字符串

意思是 反函数所得到的 字符串,他们的长度一定是连续的比如2 ,1;3ÿ

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值