索引是帮助获取数据的一种排好序的数据结构
下面先看下几种索引的数据结构,从而分析出为什么使用B+树。
1.BST(平衡二叉树)
BST 是有序的,但是当节点特别多的时候,这时候树的高度也就特别大,BST查询的时间复杂度就是和树的高度相关的,查询就会非常耗时。
2.红黑树
原因和BST相同。
3.hash表
hash表通过hash算法将数据映射一个数组里,出现hash碰撞的时候就在链表的后面添加,原理和HashMap相同,对于 = 查找速度很快,但是无法进行范围查找。
4.B树
对于BST,由于树的高度太高导致查询的效率变慢,那么针对这一问题,就出现了B树。
- 每一个节点上面存放了多个数据
- 节点上的顺序也是从小到大
- 每个数据都存了这条记录,不只是主键,还有其他列的信息
5.B+树
B树虽然已经很好的处理树的高度问题,但是由于他的每个节点上面都存了data数据,这就导致每个节点上面能保留的索引个数就很少了。这样就引出了B+树。
B+ 树将所有的data信息都放到了叶子节点上,对于B树,一个节点可能只有几条索引,但是B+树就可能有上百条索引,这样就大大的加快了查询效率。
同时B+树的叶子节点有指针指向他的下一个节点,这样就可以进行顺序查询了。
聚集索引和非聚集索引
聚集索引就是叶子节点中存放这条数据。
非聚集索引就是叶子节点存放这条数据的位置。
一般建议InnoDB表建主键,而且是自增的整型数据
首先MySQL的底层就是通过B+树来存储数据,如果我们不建立主键,那么MySQL就会自己帮我们建立这样的一个索引,假设是选择一个varchar,那么比较他的时候就会依次比较每个字符,查询的速度明显就会比整型慢的多。如果我们不是自增的情况,对于下次插入的数据比之前小的时候,因为我们要保证索引的有序性,就要去修改之前的节点,这样增加操作的次数。
非主键索引下面存的是主键值
其实就是为了节省空间,找到主键值后,只需要继续回查主键索引即可
联合索引的底层存储结构
联合索引遵循索引最左前缀原理,先比较前面的列,进行排序,第一列相同,然后再比较第二列,以此类推。