OI Wiki 对于可持久化数据结构的简介是这样的
可持久化数据结构 (Persistent data structure) 总是可以保留每一个历史版本,并且支持操作的不可变特性 (immutable)。
换而言之,可持久化数据结构是一种进阶数据结构,可以为了高效的存储一个数据结构的所有历史状态
-
为什么要用到可持续化数据结构?
到目前为止,我们学习的数据结构都是存储着它的最新状态,无法跨越时间的长河,寻找它曾经是什么
当然,实现这一点并不是完全做不到,我们可以在每次更新时,在创建一个新的数据结构,把上一个数据结构的所有内容复制过去,然后再更改
这样的话,时间复杂度与空间复杂度感人
为了高效的存储一个数据结构的所有历史状态,计算机科学家们创立了可持久化数据结构
-
可持续化数据结构的思想:
在每次操作结束后,仅创建数据结构中发生改变的部分的副本,不拷贝其他部分
这样一来,维护数据结构的时间复杂度没有增加,空间复杂度仅增长到与时间同级的规模。实现了高效的存储一个数据结构的所有历史状态
可持续化字典树
前置知识:字典树
由于我之前也没有学过字典树,所以学习可持续化数据结构时顺便把字典树也学了,这里介绍一下
让我们来看看百度百科给的概念:
又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
如果单看概念的话,你绝对会一无所获,这里给出一个简单的图
该图中存储了 c a b c a r c a t e c o s r a i n cab\ car \ cate\ cos\ rain cab car cate cos rain五个单词
为了字典树有两个基本操作,一个是插入,一个是检索。
这里我们用数组来模拟字典树
字典树的插入
当需要插入一个字符串 S S S 时,我们另一个指针 P P P 起初指向根节点,然后,依次扫描
S S S 中的每个字母 c c c :
1.若 P P P 的 c c c 字符指针指向一个已经存在的节点 Q Q Q ,则令 P = Q P=Q P=Q
2.若 P P P 的 c c c 字符指针指向空,则新建一个节点 Q Q Q ,令 P P P 的字符指针指向 Q Q Q ,然后令 P = Q P=Q P=Q
字典树的检索
当需要检索一个字符串 S S S 在 T r i e Trie Trie 中是否存在时,我们另一个指针 P P P 期初指向根节点,然后依次扫描 S S S 中的每个字符 c c c :
- 若 P P P 的 c c c 字符指针指向空,则说明 S S S 没有被插入 T r i e Trie