mysql底层数据结构

该文章摘自腾讯技术工程,作者junshili.

我们都知道mysql底层使用的是B+树进行存储,但是为什么呢?

1. 哈希表(Hash)

哈希表是做数据快速检索的有效利器。

哈希算法:也叫散列算法,就是把任意值(key)通过哈希函数变换为固定长度的key地址,通过这个地址进行具体数据的数据结构。
在这里插入图片描述
考虑这个数据库表user,表中一共有7个数据,我们需要检索id=7的数据,SQL语法是:

select * from user where id=7;

哈希算法首先计算存储id=7的数据的物理地址addr=hash(7)=4231,而4231映射的物理地址是0x77,0x77就是id=7存储的额数据的物理地址,通过该独立地址可以找到对应user_name='g’这个数据。这就是哈希算法快速检索数据的计算过程。

但是哈希算法有个数据碰撞的问题,也就是哈希函数可能对不同的key会计算出同一个结果,比如hash(7)可能跟hash(199)计算出来的结果一样,也就是不同的key映射到同一个结果了,这就是碰撞问题。解决碰撞问题的一个常见处理方式就是链地址法,即用链表把碰撞的数据接连起来。计算哈希值之后,还需要检查该哈希值是否存在碰撞数据链表,有则一直遍历到链表尾,直达找到真正的key对应的数据为止。
在这里插入图片描述
从算法时间复杂度分析来看,哈希算法时间复杂度为O(1),检索速度非常快。比如查找id=7的数据,哈希索引只需要计算一次就可以获取到对应的数据,检索速度非常快。但是MySQL并没有采取哈希作为其底层算法,这是为什么呢?

因为考虑到数据检索有一个常用手段就是范围查找,比如以下这个SQL语句:

select * from user where id >3;

针对以上这个语句,我们希望做的是找出id>3的数据,这是很典型的范围查找。如果使用哈希算法实现的索引,范围查找怎么做呢?一个简单的思路就是一次把所有数据找出来加载到内存,然后再在内存里筛选筛选目标范围内的数据。但是这个范围查找的方法也太笨

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值