常见的数据库索引数据结构
数据库索引是数据库很重要的概念,它主要的作用是提高数据库的读写效率。 常见的索引数据结构有以下3个:
- 哈希表:是一种以key-value形式存储的数据结构。是一种很常见的数据结构,使用合适的哈希函数就能算出key值对应存储的位置。 可想而知当key值很多的时候,会出现hash冲突,这个时候采用的方法是将对应位置的key值建立链表。具体实现可以对应HashMap。从上面可以看出,哈希表是无序的,所以数据库中的区间查询使用哈希表的话,效率会很差。
- 有序列表:有序列表很简单,就是一个有序的数组。它在数据库读中是最理想的数据结构。 因为查询的时候使用二分法复杂度为O(logN),因为它的有序性,使用区间的效率也很好。但是有一个致命的缺点就是,在数据库插入的时候,需要移动插入值后面的数组,开销巨大。因此这个数据结构很适合用于静态存储引擎。比如2018年全年的地址变更信息。
- 搜索树:首先说一说二叉搜索树,它的搜索和更新(即是插入的重新平衡二叉搜索树)的复杂度都是O(logN)。从复杂度来看似乎是索引存储引擎的最佳数据结构了。但是因为是二叉树,当数据量巨大的情况下,树高,也就是深度就很变得很大。例如一个100 万数据的表,树的高度就会达到20。也就是说数据库查询的时候可能需要查询20个数据快,在机械磁盘时代,这个速度会变得很慢。因此必须设计一个树来减少数据块的访问数量。这个时候B+树就诞生了,它是innoDB引擎的默认索引存储数据结构。它符合搜索树的特点,而且是一个“N叉树"。B+树的所有value都存储在叶子结点,并且所有的值又以链表相连,解决了区间查找的效率问题。