mysql底层数据结构

最新推荐文章于 2024-03-26 14:20:04 发布

爱吃洋芋菜

最新推荐文章于 2024-03-26 14:20:04 发布

阅读量2k

点赞数 2

分类专栏： mysql

本文链接：https://blog.csdn.net/weixin_43541262/article/details/107035619

版权

该文章摘自腾讯技术工程，作者junshili.

我们都知道mysql底层使用的是B+树进行存储，但是为什么呢？

1. 哈希表（Hash）

哈希表是做数据快速检索的有效利器。

哈希算法：也叫散列算法，就是把任意值(key)通过哈希函数变换为固定长度的key地址，通过这个地址进行具体数据的数据结构。
在这里插入图片描述
考虑这个数据库表user，表中一共有7个数据，我们需要检索id=7的数据，SQL语法是：

select * from user where id=7;

哈希算法首先计算存储id=7的数据的物理地址addr=hash(7)=4231，而4231映射的物理地址是0x77，0x77就是id=7存储的额数据的物理地址，通过该独立地址可以找到对应user_name='g’这个数据。这就是哈希算法快速检索数据的计算过程。

但是哈希算法有个数据碰撞的问题，也就是哈希函数可能对不同的key会计算出同一个结果，比如hash(7)可能跟hash(199)计算出来的结果一样，也就是不同的key映射到同一个结果了，这就是碰撞问题。解决碰撞问题的一个常见处理方式就是链地址法，即用链表把碰撞的数据接连起来。计算哈希值之后，还需要检查该哈希值是否存在碰撞数据链表，有则一直遍历到链表尾，直达找到真正的key对应的数据为止。
在这里插入图片描述
从算法时间复杂度分析来看，哈希算法时间复杂度为O（1），检索速度非常快。比如查找id=7的数据，哈希索引只需要计算一次就可以获取到对应的数据，检索速度非常快。但是MySQL并没有采取哈希作为其底层算法，这是为什么呢？

因为考虑到数据检索有一个常用手段就是范围查找，比如以下这个SQL语句：

select * from user where id >3;

针对以上这个语句，我们希望做的是找出id>3的数据，这是很典型的范围查找。如果使用哈希算法实现的索引，范围查找怎么做呢？一个简单的思路就是一次把所有数据找出来加载到内存，然后再在内存里筛选筛选目标范围内的数据。但是这个范围查找的方法也太笨

最低0.47元/天解锁文章

爱吃洋芋菜

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
mysql底层数据结构

该文章摘自腾讯技术工程，作者junshili.我们都知道mysql底层使用的是B+树进行存储，但是为什么呢？1. 哈希表（Hash）哈希表是做数据快速检索的有效利器。哈希算法：也叫散列算法，就是把任意值(key)通过哈希函数变换为固定长度的key地址，通过这个地址进行具体数据的数据结构。考虑这个数据库表user，表中一共有7个数据，我们需要检索id=7的数据，SQL语法是：select * from user where id=7;哈希算法首先计算存储id=7的数据的物理地址addr=.
复制链接

扫一扫