MySQL优化第一课：深入理解MySQL索引底层数据结构与算法

最新推荐文章于 2023-06-14 00:18:52 发布

学而知不足~

最新推荐文章于 2023-06-14 00:18:52 发布

阅读量863

点赞数 1

分类专栏： MySQL底层细节文章标签：数据结构 mysql 算法

本文链接：https://blog.csdn.net/upset_poor/article/details/122877628

版权

7 篇文章 1 订阅

订阅专栏

索引

MySQL采用B+树作为索引的数据结构

查看B+树一行能放多少个字节(即文件页大小）（16K）：SHOW GLOBAL STATUS like 'Innodb_page_size; 不推荐修改这个值

假设用BigInteger（8个字节）存储键key，一个文件页就能放16384 / (6(地址大小) + 8) = 1150个键
高度为3的B+树能存的数据 = 1150 * 1150 * 16（叶子节点1个数据大概1K，能放16K）
大概是千万数据，所以建了索引比不建索引快了非常多
为什么文件页大小选择16K
大量实践证明比较好
为什么选B+树不选B树
因为B树带了数据，因此一个文件页只能存16个数据
假设2000万数据，B树的高度为log16(2000万)，结果肯定是远远大于B+树的高度

磁盘上会有3个文件：.frm（frame表结构文件） .MYD（数据文件） MYI（索引文件）

InnoDB在磁盘上有两个文件：.frm（表结构文件） .ibd（数据文件）

表数据文件本身就是按B+树组织的一个索引结构文件
聚集索引：叶子节点包含了完整的数据记录，只有一个聚集索引（主键索引）
为什么建议InnoDB表必须建主键，并且推荐使用整型的自增主键？
- 是为了建立对应的B+树，如果没有主键，MySQL内部会自己遍历所有列，找到一列没有相同元素的作为B+树的key，如果找不到，就会创建一个隐藏列，类似于UUID，唯一表示每一行
- 但是MySQL的资源很宝贵，不应该浪费在这种事情上
- 而整型比较大小时间快，从而查找效率高，所以推荐使用整型
- 插入非自增的键时，B+树需要分裂以及平衡，而自增的键则不需要
为什么非主键索引结构叶子节点存储的是主键值？（一致性和节省存储空间）
- 维护索引的时候只需修改主键索引
- 节约空间

关注

专栏目录