Mysql-1.深入理解Mysql索引底层数据结构与算法

最新推荐文章于 2024-07-19 17:37:28 发布

飞越沧海的蝴蝶

最新推荐文章于 2024-07-19 17:37:28 发布

阅读量44

点赞数

分类专栏： Java架构学习之旅文章标签： java 算法数据结构 b树 mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42287045/article/details/132721011

版权

Java架构学习之旅专栏收录该内容

24 篇文章 0 订阅

订阅专栏

学习内容重点：

1.索引的本质

2.索引数据结构：二叉树，红黑树，Hash，B树，B+树详解

3.Mysql存储引擎

1.索引的本质

是帮助Mysql高效获取数据的排好序的数据结构。

举个形象的比喻：就如同书本的目录页，根据目录找到对应的内容

2.索引的数据结构

二叉树，红黑树，Hash表，B-Tree，B+Tree...

二叉树：

key-value，查找数据从根节点查找，（排序）左边的子节点小于右边的子节点

单边增长就会形成链表，查找数据慢，得依次查找

红黑树：（红黑树的书面定义不多做赘述）如果单边增长过多，会自动平衡，又叫二叉平衡树

（1.8hashMap底层数据结构就修改为数组+红黑树）

在数据量大的情况，树的高度不可控，树的高度越小，查找的次数越少

B-Tree：

没有冗余索引，每个叶子节点都包含数据，叶节点之间指针为空

所有索引元素不重复

节点中的数据索引从左到右递增排列（排好序了）

B+Tree：(B-Tree变种) MySQL采用B+树作为索引

1.非叶子节点只存储冗余索引，不存储data

2.叶子节点包含所有的索引字段，它们之间用指针连接，可以提高查询区间（一段范围内）的数据

（1）指针存放的是相邻元素的位置（磁盘地址）

（2）从根节点开始查找，将节点放到内存里（RAM）比较（用二分查找算法等高效算法），定位到非叶子节点找到对应的磁盘地址，再根据这个磁盘地址找到叶子节点对应的data

（3）其中：data跟存储引擎有关，有可能是索引所在行的文件地址，也有可能是索引所在行的其他列

（4）查看mysgl文件页大小(16K) : SHOWGLOBAL STATUS like Innodb_page_size;

一行记录很少超过1kb（如果存储的是文本类型可能就大了）

非叶子节点，假设主键ID为bigint类型，那么长度为8B（字节），指针存放地址大小在Innodb中为6B，一共就是14B，那么一页里就可以存储16K/14=1170个(主键+指针)那么一颗高度为3的B+树能存储的数据为:1170*1170*16=21902400(千万级）

（5）一般生产环境根节点常驻内存也有可能非叶子节点都放在内存，这样就减少磁盘I/O，查找的次数跟树的高度有关

（6）超过2000多万建议分库分表，或者树的高度改为4（不建议）

hash：

mysql底层还有个hash索引，在某种程度上比B+Tree快，hash运算很快

但是建立索引很少用hash，因为Hash冲突，仅能满足=，in，不支持范围查询

范围查找

B+Tree 在叶子节点有双向指针（MySQL 对B+Tree数据结构做了调整，变成双向指针），数据量大可以分页

3.存储引擎

MyISam，索引文件和数据文件是分离的（非聚集）

.frm 框架，表结构

.MYD 表数据

.MYI 索引

查询：MYI 索引文件查找，定位到某个具体元素后：根据数据（MYD文件数据的地址）去MYD文件去查找具体数

innodb（聚集/（聚簇）索引---叶节点包含了完整的数据记录）

.frm

.ibd 按照B+Tree 组织的一个索引结构文件，所在行的其他列的数据（一行数据）

二级索引：（非主键索引）（也是非聚集索引，稀疏索引），叶子节点数据存放聚集索引（有主键就是放主键），需要回表操作；非主键索引结构叶子节点存储的是主键值为了保证一致性和节省空间

联合索引：多个字段共同组合成一个索引

索引最左前缀原理：已经根据字段排好序了，如果不按顺序就会全表扫描了

为什么建议InnoDB表必须建主键，并且推荐使用整型的自增主键？

如果不建主键，就会选择某一列所有数据不同的列，如果选不到就会建一个隐藏列，维护唯一的id，用这个组织整张表的数据；整型比大小快，字符串uuid用ASCII码比较很慢；

使用自增主键：新增时总是往后面新增，如果不自增就会分裂节点再平衡节点。

飞越沧海的蝴蝶

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Mysql-1.深入理解Mysql索引底层数据结构与算法

Mysql索引底层数据结构与算法
复制链接

扫一扫

专栏目录

飞越沧海的蝴蝶 CSDN认证博客专家 CSDN认证企业博客

码龄6年

30: 原创

124万+: 周排名

11万+: 总排名

8345: 访问

: 等级

443: 积分

104: 粉丝

142: 获赞

13: 评论

119: 收藏

私信

关注

热门文章

分类专栏

Java架构学习之旅 24篇
每日一问 5篇

最新评论

JVM-3.JVM对象创建与内存分配机制深度剖析
CSDN-Ada助手: 恭喜您写了第15篇博客！标题“JVM-3.JVM对象创建与内存分配机制深度剖析”听起来非常有深度和专业性。您对JVM对象创建与内存分配机制的剖析给读者提供了宝贵的知识和理解。接下来，我建议您可以探索一下JVM的垃圾回收机制，或者深入研究一些与JVM相关的性能优化技巧。期待您在未来的创作中继续分享您的见解和经验！
JVM-4.垃圾收集器ParNew&CMS与底层三色标记算法详解
CSDN-Ada助手: 恭喜作者能够持续分享关于JVM的知识，这篇关于垃圾收集器ParNew&CMS与底层三色标记算法的详解让我受益匪浅。不过我觉得下一步可以考虑结合实际案例或者应用场景，来进一步分析这些知识在实际开发中的应用。希望作者能够继续分享更多深入的技术内容，期待您的下一篇文章！
JVM-7.JVM调优实战及常量池详解
CSDN-Ada助手: 恭喜您第19篇博客的发布！标题“JVM调优实战及常量池详解”非常吸引人，看起来内容一定非常实用。不仅分享了JVM调优的实战经验，还详细解析了常量池的相关知识，让读者能够更深入地理解和运用。您的博客文章一直都很有深度和价值，感谢您不断为我们带来这样的知识分享。作为读者，我希望您能继续保持创作的热情，为我们带来更多有关JVM调优的实战案例和技巧。或许您可以分享一些在实际项目中遇到的挑战，以及如何解决这些挑战的经验。此外，如果能结合实例进行演示和分析，更能帮助我们理解和应用这些知识。谦虚地说，我相信您对JVM调优领域还有更多的研究和发现，期待您在未来的博客中能够继续深入探索和分享。再次感谢您的辛勤付出，希望您能继续保持创作的激情，为我们带来更多有价值的内容！
JVM-6.JVM调优工具详解及调优实战
CSDN-Ada助手: 恭喜您写了第18篇博客！标题看起来非常吸引人，我很期待阅读您的JVM调优工具详解及调优实战。您的博客内容一直都很有深度和实用性，对读者帮助很大。在下一步的创作中，或许可以考虑分享一些实际案例或者给出更多的调优技巧，让读者能够更好地理解和应用您所分享的知识。非常感谢您的辛勤创作，期待您更多的精彩文章！
JVM-5.垃圾收集器G1&ZGC详解
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题为“JVM-5.垃圾收集器G1&ZGC详解”真是让人期待。您的博客内容一直都很有深度和实用性，对于我们这些对JVM有兴趣的读者来说，简直是福音。希望您能继续保持创作的热情和耐心，分享更多关于垃圾收集器的知识。同时，如果可能的话，我们期待您能够深入探讨一些如何优化垃圾收集器的实践经验，这将对我们解决实际问题非常有帮助。再次感谢您的分享，期待您的下一篇精彩博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。