Hash索引
优点
查询效率高,直接通过hash算法算出hash值,根据hash值定位到buckets中,再将该bucket的entry全部加载到内存中,entry是一个链表,进行遍历就能定位到想要查找的值
缺点
虽然hash索引的查询效率高,但是也有很多限制和弊端
- 仅仅能满足
in
或=
,不能使用范围查询。因为经过相应的hash算法,处理过的hash值并不能保证和hash运算前的值保持完全一致 - 无法用来避免数据的排序操作。同样的,因为经过相应的hash算法,处理过的hash值并不能保证和hash运算前的键值保持完全一致,所以数据库无法利用索引的数据来避免排序运算。
- 不能利用部分索引键查询。hash索引在计算hash值时,是组合键。就是将组合索引键合并之后再一起进行运算的hash的值,而不是单独计算hash的值的,所以通过组合索引的前面一个或多个索引键进行查询的时候,hash索引也无法被利用。而B+树是支持利用组合索引中的部分索引的。
- 不能避免表扫描。hash索引,是将索引键通过hash运算,将运算后的hash值和所对应的行指针信息,存放在一个bucket中,由于不同的索引键存在相同的hash值,所以即使取出某个满足hash键值的数据,也无法直接完成查询。还是要通过访问buchet中的实际数据进行比较。
- 遇到大量hash值相等的情况后性能不一定比b树索引高。对于选择性比较低的索引键,如果创建hash索引那么将会存在大量指针信息存放在同一个bucket中的情况,从而造成总体性能非常低下,就像二叉树一样,可能会出现线性存储的结构。