B+树
B+树是基于B树和叶子节点顺序访问指针实现的。
B树是一棵平衡查找树,其所有的叶子节点都在同一层。
B+树的节点从左至右,非递减排序。即左指针指向的节点<=中间指针指向节点<=右指针指向节点。
-
操作
- 查找:从根节点进行二分递归查找,直至找到叶节点,然后在叶子节点上进行二分查找,直至确认元素位置
- 插入:因为元素的插入会破坏B+树的平衡性,所以需要对树进行分裂、合并和旋转来维护平衡性
-
特点
B+树的有序性决定了它较快的查找速度,并且还适用于排序和分组。 -
与红黑树进行比较
红黑树是一棵非严平衡的二叉搜索树。- B+树的树高比较低,所以寻址速度比较快
- 因此B+树经常被用来做为文件系统和数据库系统的索引结构。
-
与Hash索引相比:
Hash索引可以以O(1)时间复杂度进行查找,但是不适用于分组和排序。
Hash索引的查找是进行全表扫描的,因此只支持精确查找,不支持范围查找和部分查找。只适用于=或者<=>操作符的等式比较
优化器不能使用Hash索引来优化order by的操作
索引优化
- 独立的列:查询语句中,索引不能作为表达式的一部分也不能作为函数的参数
- 多列索引:在需要使用多个列作为条件进行查询时,使用多列索引比使用多个单列索引性能更好。
- 唯一索引:即某一列的重复值比较少,最好都是互不相同,这样的列做索引,选择性越高,每个记录的区分度越高,查询效率也越高。
- 短索引:对于字符串列索引,应该指定前缀长度(选择最短的不重复的前缀)