mysql为什么用B+树

为什么不用哈希(又名散列)

  • 哈希表即散列表,原理就是用hash函数,将我们存的数据,以关键字的形式转换为hash值,然后根据hash值在内存中储存数据
  1. 无论读还是写,哈希都比树更快,那为什么索引结构要选用树型结构呢?因为对于分组、排序、比较,哈希型索引的时间复杂度会退化到O(n),且实际应用中,数据量数百万级别后,时间比较长。
  2. hash算法会存在hash冲突,尽管用了扰动函数,但数据量大了之后,还是会存在分布不均(扰动函数1扰动函数2

为什么不用二叉树

  1. 二叉树每个节点只分两个叉,每个节点只能存储一个记录,随着数据量的增大,树的高度会显著增高,而的高度越高,查询速度就越慢。
  2. 高度增加后,数就变成列表了,时间复杂度也就趋近与O(n)

为什么不用B-树

  1. B-树每层节点数目非常多,层数很少,相比二叉树减少了磁盘IO次数,但每个节点都存储数据,查询需要进行中序遍历,并不是快速定位数据的最佳方式。

AVL树

  1. 带有平衡条件:每个结点的左右子树的高度之差的绝对值(平衡因子)最多为1。也就是说,AVL树,本质上是带了平衡功能的二叉查找树。虽然数平衡了,查询比较快,但是,当插入数据的时候,为了达到平衡,得多次旋转。数据量大以后,旋转就特别耗时

红黑树

  1. 非平衡二叉树,但是数据大了,查询也会比较费时

B树

  1. 计算机数据IO时,查询数据没用连续读写。用的是4k或者N*4k读写。这样的好处是查询比较快
  2. 在这个4k的数据单元中。B树叶子节点存放了key和数据。这样,导致数据量越大,这个数据单元的数据就越多。若数据+key达到2k。那么每个节点就只能放2个数据了。

为什么用B+树,而不用B树

  1. B+树在B树基础上进行了改进,数据只存储在叶子节点上,且叶子节点之间增加了链表,这样获取节点时,不用中序遍历,这样便于快速定位数据,是减少磁盘IO的最佳方式。

 

 

 

 

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值