后缀树的生成——如何做到简单快速(含源码)

最新推荐文章于 2022-06-24 23:16:35 发布

mymodian

最新推荐文章于 2022-06-24 23:16:35 发布

阅读量2.4k

点赞数 3

分类专栏：数据结构文章标签：后缀树生成源码简单快速

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mymodian9612/article/details/15990309

版权

本文介绍了如何简单快速地生成后缀树，包括两个步骤：初始化和扫描所有后缀。详细阐述了处理不同查找情况的过程，并通过实例演示了生成流程，最后提供了实现代码。

摘要由CSDN通过智能技术生成

最近两个月一直在看JULY的“结构之法算法之道”，链接：http://blog.csdn.net/v_JULY_v，收获颇多，在此感谢！其中一篇讲到后缀树的，http://blog.csdn.net/v_july_v/article/details/6897097，讲解了后缀树的结构特征、生成方法和一些用处，看了很久，但还是觉得其中的生成方式比较复杂，要具体实现的话，编码难度有点大，很多编程经验不是很好的都很难正确的编写出来。因此，我希望能得到一个编码难度小，且速度较快的生成方式。终于，在很多次研究各种字符串生成过程后，找到了一个很简单而且速度比较快的生成方式。现描述如下：

step 1 :
initialise: 扫描给定字符串的每一个字符，如果该字符和根节点的每一个儿子首字母都不同，则将以此字符为首的整个后缀插入到根节点的儿子中；

step 2：

scan_all_suffix:
             然后从给定字符串的最长后缀到最短后缀依次按trie树的方式在初步建立的树中查找，肯定会出现以下3种情况之一：
             情况一：如果查找成功，则当前后缀处理完成，继续查找下一个后缀；
            情况二：如果对比完一个节点都符合，但在其子节点中找不到下一个分支，查找失败，则直接用当前后缀剩下的字符串建立新节点，并作为当前节点的一个子节点；
             情况三：否者，一定会在一个节点字符串的第 k 个字符处出现查找失败，假设此时已经查找到当前后缀的第m个字符处，这时就可以分割该节点:

1. 以当前查找节点从 k 开始的后缀建立新节点，并作为当前查找结点一个子节点；

2. 当前扫描的后缀从 m 开始的后缀建立新节点，作为其另一个子节点；

3.将当前节点从k开始的后缀去掉；

当运行完上面两个循环后，一颗后缀树就建立完成了。

现结合一个实例演示一下流程：

建立字符串 aabac 的后缀树：

根据上面的step1，就可以得到下面的树结构：

最低0.47元/天解锁文章

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。