可拓展性Hash
前言
在数据库的索引中,一般有两种结构的实现方式,B+树的实现方式和基于Hash的索引方式。伴随着存储设备的不断降价,Hash表这种以空间换时间的策略也越来越受欢迎。比如在Mysql中就有B+树和Hash索引两种的实现方式。
Hash索引分为静态索引、可拓展性索引和线性索引三种方式。
静态索引就是直接对数据进行Hash分区存放,当数据超过可存放大小的时候,就采用溢出页的方式或者重建Hash的方式,消耗比较大,一般都不推荐。所以就剩下了两个选择,可拓展性索引和线性索引。本文主要介绍可拓展性索引。
介绍
为了理解可拓展性Hash,我们可以先想象静态Hash的使用。当一个Hash分区超过可存储容量的时候,除了溢出页,我们就只能将分区数扩大,重新建立Hash分区了,由于所有数据都要变化,所以这种消耗很大,可拓展性Hash就是为了解决这个问题而产生的。
上图就是一个基本的可拓展性Hash,初始化的时候,默认进行了四个分区,分别对应分区0-4。目录中包含了对每个分区的指向。当需要查询数据的时候,只需要简单的计算hash值,查看二进制的最后两位,就可以得到所在的hash分区。从而获取数据。上图中目录的全局深度和分区的局部深度都为2。
存储
正常情况下,数据插入的时候,只需要放入默认的分区即可。在此不在叙述。
当分区已经饱和的时候&#x