既然Hash结构效率高,那为什么Innodb引擎的索引结构还要设置成B+树型呢?

既然Hash结构效率高,那为什么Innodb引擎的索引结构还要设置成B+树型呢?

要搞清楚这个问题,我们首先聊聊为什么Hash结构效率高,高再哪?

Hash是一种经典的数据结构,你可以简单的理解成由一个数据和很多链表构成;Hash的特性就是键值对,即(K,V),我们如果想插入元素时,先计算出这个元素的哈希值,然后通过不同的哈希函数,求出K,常用的比如 取模 法,求出K之后,将V的值存储到这个K的位置对应的链表;

之所以快是因为相对B+树来说,哈希可以通过元素的哈希值快速的算出K,然后接下来完成增删改就很快。

但为什么Innodb不选择hash结构呢?

  1. 哈希仅能满足 = <> in 即(等值查询) ,但是对于范围查询 (> ,<, >=,<= …),哈希索引的时间复杂度就会由O(1)退化为O(n),[为什么这么说呢?因为K的值在数组里面存储并不是按照顺序存储的,并不是按照(1,2,3,4,…)或者(n,n-1,…,5,4,3,2,1) 升序或者降序存储的,而是乱序存储的(5,7,3,1,9,6)类似于这样乱序存储的],所以当进行范围查询的时候,对于哈希索引来说,我们就会一个值一个值的去在给出的范围里面对比,所示时间复杂度退化为了O(n),而对于树型的"有序性",依然能够保持O(log n)的事件复杂度

  2. 因为Hash索引里面数据的存储是没有顺序的,所以当进行order by 排序的时候,使用哈希索引还要重排序

  3. 对于联合索引来说,哈希值是根据联合索引的键合并一起后计算出来的,无法对单独的一个索引键或者几个索引键进行查询

  4. 虽然哈希索引进行等值查询效率高,但是如果这个索引列中含有大量重复的值,效率也会变低。

    因为遇到Hash冲突时,需要遍历桶中的行指针进行比较,找到查询的关键字非常耗时,所以hash索引通常不会用到索引列对应重复值高的字段上,比如性别,年龄

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: MySQL 使用 B-Tree 而不是 Hash 索引是因为 B-Tree 有许多优点。 1. 支持排序:B-Tree 索引可以支持排序,因此支持顺序查找。Hash 索引则不能支持排序,因此只支持随机查找。 2. 支持范围查询:B-Tree 索引可以支持范围查询,因此支持区间查询,而 Hash 索引则不能。 3. 支持分块查询:B-Tree 索引使用分块查询,因此可以支持大数据量的查询,而 Hash 索引则不能。 4. 支持磁盘存储:B-Tree 索引可以使用磁盘存储,因此占用内存较少,而 Hash 索引则需要使用内存,因此内存占用较多。 因此,B-Tree 索引Hash 索引更适合用于大数据量的数据库系统,特别是在排序和范围查询等方面。 ### 回答2: MySQL中使用B-tree而不是Hash索引是为了更好地支持范围查询和排序操作。Hash索引是基于哈希算法索引,它将索引值直接映射到哈希表中的位置,可以实现非常快速的查找操作。但是,它并不适合处理范围查询和排序操作。 首先,Hash索引是无序的,无法支持范围查询。范围查询需要按一定的顺序访问索引中的数据,而Hash索引无法提供这样的顺序。 其次,Hash索引在处理排序操作时效率较低。排序操作需要根据索引中的数据值进行排序,但是Hash索引中的数据值是无序的,因此需要额外的操作来实现排序。 而B-tree索引是一种平衡的树状数据结构,可以支持按范围查询和排序操作。B-tree索引索引值按顺序组织在树中的节点中,可以在树的节点之间进行高效的跳跃和遍历,从而实现快速的范围查询和排序操作。 此外,B-tree索引适用于磁盘存储,而不仅仅是内存存储。数据库中的数据通常存储在磁盘上,而不是全部加载到内存中。B-tree索引结构特性能够适应磁盘存储的特点,减少磁盘IO次数,提高索引的检索效率。 综上所述,为了更好地支持范围查询和排序操作,并适应磁盘存储的特点,MySQL选择使用B-tree而不是Hash索引。 ### 回答3: MySQL索引使用B树而不是哈希的主要原因有三个。 首先,B树适合磁盘存储,而哈希适合内存存储。在磁盘上,数据是分块存储的,每个块可以容纳多个数据。B树结构能够更有效地利用磁盘上的块,减少磁盘I/O次数,提高数据的读取效率。而哈希则不适合磁盘存储,因为哈希表需要一次完成整个表的读取,对于大数据量的表来说,哈希表会导致大量的磁盘I/O,性能较差。 其次,B树适合范围查询,而哈希不适合。在MySQL中,经常需要使用范围查询,如大于、小于、区间等。B树的有序特性使得范围查询非常高效,只需要遍历指定范围的节点即可。而哈希表的数据分布是随机的,无法提供有序性,无法高效地支持范围查询。 最后,B树支持数据的顺序访问,而哈希不支持。B树的左子树保存的是小于父节点的数据,右子树保存的是大于父节点的数据,这种有序性使得B树能够很好地支持数据的顺序访问。而哈希表的数据分布是随机的,无法提供有序性,不能有效地支持数据的顺序访问。 综上所述,由于MySQL的索引需要适应磁盘存储、范围查询和数据的顺序访问,B树是一种更适合的数据结构,而哈希表在这些方面表现较差,因此MySQL索引选择使用B树而不是哈希。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

C_x_330

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值