mysql索引
前言
1.为什么需要索引?
假设存在一个int数据占4个byte,所以一个磁盘可以存那么1000条数据,存在100万条这个数据,需要1000个磁盘块,假设7200转的磁盘遍历1000个磁盘,就需要9ms * 1000 = 9s 。
一、做到快速查询解决的思路
硬盘读取数据的速度一定,所以需要加速读取只能通过减少io的次数来达到目的。
二、快递遍历方法
1.循环遍历查询
时间复杂度为O[n],不推荐。
2.二分法查询
时间复杂度是O[log n]查询速度很快,但是需要数据有序。当我们重新使用磁盘,将数据排序,当设计CRUD等操作时,会大量占用磁盘时间,所以不推荐。
3.链表
链表就是数据一父子的方式存在的一串数据时间复杂度是O[n],查询不稳定。
单链表
calss Node_a{
private Object data;
private Node_a nextNode;
}
双链表
calss Node_b{
private Object data;
private Node_a nextNode;
private Node_a prevNode;
}
3.二叉查找树
当二叉树数据无序时时间复杂度是O[log n]
当二叉树数据有序时时间复杂度是O[n],和单链表相同。
当数据量变大,树高度变高,假设每个节点是一个磁盘块,查取速度太慢,不可取。同平衡二叉树(AVL树)都是不可取的。
4.B-树
以上图为例根节点是17
和35
,所以p1
的范围是小于17
,p2
的范围是17
到35
,p3
是大于35
在mysql中,当读取一页,也就是16kb的存储空间的时候,假设一页可以存储1000条数据,那第二层就可以存储10002条数据,第三条就可以存储10003数据,也就是10亿条,这样我们查找某一个数据只需查找三页,速度还是十分可以的,但是如果是范围查询,就会十分不理想,并不太合适数据库。
5.b+树
特点是所有的数据都存在子节点里,相比起来和b-树,当某一个数据量很大,占用空间很大时,子节点会很长,查询某一个数据的速度会比不上b-树。
mysql的数据引擎
InnoDB
主键索引:每张表只有一个主键索引,叶子节点同时保存了主键的值(图中的id)
和数据记录
,其他节点只存储索引指端的值。
辅助索引:每个表可以有多个,b+树结构,叶⼦节点保存了索引字段的值
以及主键的 值(图中的id)
,其他节点只存储索引指端的值。
MyISAM
B+树结构,MyISM使⽤的是⾮聚簇索引
,⾮聚簇索引的两棵B+树看上去没什么不同,节点的结构完全⼀致只是存储的内容不同
⽽已。
主键索引:B+树的节点存储了主键
。
辅助键索引:B+树存储了辅助键
。
表数据存储在独⽴的地⽅,这两颗B+树的叶⼦节点都使⽤⼀个地址指向真正的表数据
,对于表数据来说,这两个键没有任何差别。
由于索引树是独⽴的,通过辅助键检索⽆需访问主键的索引树。
mysql的应用
mysql
的最多的是innodb
存储引擎,所以此处主要说⼀下innodb
索引的情况,innodb
中
最好是采⽤主键查询,这样只需要⼀次索引,如果使⽤辅助索引检索,涉及到回表操作
,⽐主键查询要耗时⼀些。
页结构
mysql中页是innodb中存储数据的基本单位,也是mysql中管理数据的最⼩单位,和磁盘交互的时候都是以页来进⾏的,默认是16kb,mysql中采⽤b+树存储数据,页相当于b+树
中的⼀个节点。
总结
待续。。。