一、myql索引底层数据结构与算法
二、mysql——Explain工具介绍
三、mysql——索引最佳实践
四、mysql索引优化实战
五、mysql——常见sql语句优化
六、mysql索引优化实战二
七、mysql事务隔离机制和锁机制
索引是帮助mysql高效获取数据的排好序的数据结构。
索引数据结构——为什么mysql底层使用B+树?
一、二叉树
当数据是有序递增的时候,二叉树退化为链表结构,查询效率低,比如查询数字5,需要查询5次。
二、红黑树
查询5的时候需要查询4次
B树
叶节点具有相同的深度,叶节点的指针为空;
所有的索引元素不重复
节点中的数据索引从左到又依次递增
查询5的话,需要查询3次。
四、B+树
非叶子节点不存储data,只存储索引(存在冗余),可以放更多的索引(mysql中用数据页存储,不存data,可以放更多的索引)。
叶子节点包含所有的索引
叶子节点用指针连接,提高区间之间的访问能力
查询5的话,查询2次就可以了,明显查询效率更高,而且叶子节点包含data,并且是有序的,而且有链表,范围查询效率也会很高。
Hash结构
对于一些索引,一次hash算法就可以定位
但是仅能满足“=”,“in”等,不支持范围查找
hash冲突还要再在链表上查找
B+树对比B树的优点:
1、非叶子节点不存储数据,那么每个数据页中可以放更多的索引,当数据量大的时候,可以更好的控制树的高度,而且将查询定位过程与加载数据过程分离,提高了查询效率;
2、叶子节点之间的链表相连的设计,提高了范围查询的效率。
非聚集索引
叶子节点中存储的是表格中数据的地址;根据索引先定位到数据的地址,然后再根据数据地址去查找具体的数据;
聚集索引
叶子节点中存储的就是完整一条数据;根据索引定位到数据地址,直接返回数据即可。
为什么innodB建议必须建主键,而且使用整型的自增主键?
如果你不主动建立主键,那么mysql会从你的数据中挑选中一列没有重复的数据建立索引,如果没有合适的列,mysql会给你的数据额外添加隐藏的一列建立索引;总之,你不做,就会增加mysql的负担;
为什么使用整整型,因为整型占用的空间比较小,而且比较起来效率高;
为什么要是自增
因为构建索引的B+树结构时,如果是递增的数据,那么不会带来树的分裂的影响,效率高。
非主键索引
为什么非主键索引,叶子节点存储的是主键值?
一致性和节约空间;
如果非主键索引,存储的也是具体的数据,那么数据更新时,将会需要同时更新主键索引和非主键索引,容易引起数据不一致的问题。
非主键索引存储具体的数据,也会浪费磁盘空间。