mysql里面的索引探究

王庆淮

已于 2022-07-01 13:43:58 修改

阅读量266

点赞数

分类专栏：数据库文章标签： mysql 数据库 java

于 2022-07-01 11:04:24 首次发布

本文链接：https://blog.csdn.net/huaidadaa/article/details/125552873

版权

数据库专栏收录该内容

1 篇文章 0 订阅

订阅专栏

mysql索引

文章目录

mysql索引
前言
一、做到快速查询解决的思路
二、快递遍历方法
mysql的数据引擎
- mysql的应用
页结构
总结

前言

1.为什么需要索引？
假设存在一个int数据占4个byte，所以一个磁盘可以存那么1000条数据，存在100万条这个数据，需要1000个磁盘块，假设7200转的磁盘遍历1000个磁盘，就需要9ms * 1000 = 9s 。

一、做到快速查询解决的思路

硬盘读取数据的速度一定，所以需要加速读取只能通过减少io的次数来达到目的。

二、快递遍历方法

1.循环遍历查询

时间复杂度为O[n]，不推荐。

2.二分法查询

时间复杂度是O[log n]查询速度很快，但是需要数据有序。当我们重新使用磁盘，将数据排序，当设计CRUD等操作时，会大量占用磁盘时间，所以不推荐。

3.链表

链表就是数据一父子的方式存在的一串数据时间复杂度是O[n]，查询不稳定。
单链表

calss Node_a{
private Object data;
private Node_a nextNode;
}

双链表

calss Node_b{
private Object data;
private Node_a nextNode;
private Node_a prevNode;
}

3.二叉查找树

当二叉树数据无序时时间复杂度是O[log n]
无序二叉树当二叉树数据有序时时间复杂度是O[n]，和单链表相同。
有序二叉树
当数据量变大，树高度变高，假设每个节点是一个磁盘块，查取速度太慢，不可取。同平衡二叉树（AVL树）都是不可取的。

4.B-树

3阶B杠树以上图为例根节点是17和35，所以p1的范围是小于17，p2的范围是17到35，p3是大于35
在mysql中，当读取一页，也就是16kb的存储空间的时候，假设一页可以存储1000条数据，那第二层就可以存储1000²条数据，第三条就可以存储1000³数据，也就是10亿条，这样我们查找某一个数据只需查找三页，速度还是十分可以的，但是如果是范围查询，就会十分不理想，并不太合适数据库。

5.b+树

b+树结构图
特点是所有的数据都存在子节点里，相比起来和b-树，当某一个数据量很大，占用空间很大时，子节点会很长，查询某一个数据的速度会比不上b-树。

mysql的数据引擎

InnoDB和MyLSAM的差别
InnoDB
主键索引：每张表只有一个主键索引，叶子节点同时保存了主键的值（图中的id）和数据记录，其他节点只存储索引指端的值。
辅助索引：每个表可以有多个，b+树结构，叶⼦节点保存了索引字段的值以及主键的值（图中的id），其他节点只存储索引指端的值。
MyISAM
B+树结构，MyISM使⽤的是⾮聚簇索引，⾮聚簇索引的两棵B+树看上去没什么不同，节点的结构完全⼀致只是存储的内容不同⽽已。
主键索引：B+树的节点存储了主键。
辅助键索引：B+树存储了辅助键。
表数据存储在独⽴的地⽅，这两颗B+树的叶⼦节点都使⽤⼀个地址指向真正的表数据，对于表数据来说，这两个键没有任何差别。
由于索引树是独⽴的，通过辅助键检索⽆需访问主键的索引树。

mysql的应用

mysql的最多的是innodb存储引擎，所以此处主要说⼀下innodb索引的情况，innodb中
最好是采⽤主键查询，这样只需要⼀次索引，如果使⽤辅助索引检索，涉及到回表操作，⽐主键查询要耗时⼀些。

页结构

mysql中页是innodb中存储数据的基本单位，也是mysql中管理数据的最⼩单位，和磁盘交互的时候都是以页来进⾏的，默认是16kb，mysql中采⽤b+树存储数据，页相当于b+树
中的⼀个节点。
页结构
页结构详情 page结构组成
page主体
总数据结构

总结

待续。。。

王庆淮

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
mysql里面的索引探究

1.为什么需要索引？假设存在一个int数据占4个byte，所以一个磁盘可以存那么1000条数据，存在100万条这个数据，需要1000个磁盘块，假设7200转的磁盘遍历1000个磁盘，就需要9ms * 1000 = 9s 。硬盘读取数据的速度一定，所以需要加速读取只能通过减少io的次数来达到目的。时间复杂度为O[n]，不推荐。时间复杂度是O[log n]查询速度很快，但是需要数据有序。当我们重新使用磁盘，将数据排序，当设计CRUD等操作时，会大量占用磁盘时间，所以不推荐。链表就是数据一父子的方式存在的一串数
复制链接

扫一扫