分割树常常用来分割‘值空间’,比如二叉搜索树,堆。这节课为了让字符串更好索引,用树来分割它的字母空间。如下图,我们可以不停分割直到剩余的是单一字母(即叶子节点)
可以简化
两个问题:
1 你弄完这个还能搞索引吗?RSA操作
2 这个树有多大?
在此文中,旨在解决第一个问题,RSA还能用吗?指向之前提到的压缩问题(对A有影响)
可以看到,在这个树里,每个节点都是bitvector,我们可以通过求解子问题,来merge到对字符串的RSA
上图是字符串的RSA操作,把0和1换成对应字符就好。
access操作可以通过rank和access实现,多品品。而且由于各项操作都是O(1),整个检索过程只需花O(logN)而不是O(1)(开玩笑)