MySql(29)MySQL数据结构选择合理性

Hash 结构

Hash 本身是一个函数,又被称为散列函数,他可以帮助我们大幅度提升检索效率。

Hash算法是通过某种确定的算法(比如MD5)将输入转变为输出。 相同的输入永远可以有相同的输出

加速查找速度的数据结构,常见的有两类

  1. 树,例如平衡二叉树,查询、插入、修改、删除的平均时间复杂度都是 O(log2N)
  2. Hash,例如HashMap,查询、插入、修改、删除的平均时间复杂度都是 O(1)

采取Hash进行检索效率非常高,基本上一次检索就可以找到数据,而 B+Tree 需要自顶向下依次寻找,多次访问节点才能找到,中间需要多次 IO 从效率来说 Hash 比 B+Tree 更快

Hash结构效率高,那为什么索引结构要设计成树型呢?

  1. Hash索引仅能满足 = <> 和 IN 查询,如果进行 范围查询,哈希型的索引,时间复杂度会退化为 O(n);
  2. Hash 索引无序,当order by 的情况下,Hash索引还需要对数据重新排序。
  3. 对于联合索引,Hash值是将联合索引键合并后一起来计算的,无法单独对一个索引或者几个索引键进行查询。
  4. 如果 索引列重复很多,效率就会降低。这是因为Hash冲突时,需要遍历指针来进行比较。
索引 存储引擎MyISAMInnoDBMemory
HASH索引不支持不支持支持

Hash索引的适用性
Redis 存储的核心就是 Hash表

使用Memory存储引擎进行等值查询是个不错的选择

InnoDB 不支持 Hash索引,但是提供了 自适应Hash索引 当某个数据经常被访问,但满足一定条件,就会将这个数据页的地址存到Hash表中。

二叉搜索树

特点

  • 一个节点只能有两个子节点,也就是一个节点度不能超过2
  • 左子节点<本节点;右子节点>=本节点

查找规则

  1. 如果 key 大于根节点,则在右子节点查找;
  2. 如果 key 小于根节点,则在左子节点查找;

二叉树
在这里插入图片描述

二叉搜索树但已经退化成一条链表了
在这里插入图片描述

深度过高会导致IO过多,就需要 降低树的高度于是出现了 AVL树

AVL树 (平衡二叉搜索树)

它要么是一颗空树,要么是左右两个子树的高度差不超过一,并且左右两个子树都是平衡二叉树

常见的平衡二叉树有很多种,包括 平衡二叉搜索树 红黑树 数堆 伸展树

在这里插入图片描述

在这里插入图片描述

再之后就出现了B-Tree

B-Tree(B树)

又叫做 多路平衡查找树,它的高度远小于平衡二叉树的高度

B树B+树 不同,B树的叶子节点和非叶子节点都存放数据,搜索有可能在非叶子节点结束。
在这里插入图片描述

B+Tree(B加树)

B+树也是多路搜索树, 基于B树进行改进
主要差异为:

  • 有k个子节点就有k个关键字。也就是每个关键字都对应一个子节点,而B树中子节点数量=关键字+1
  • 非叶子节点的关键字也会同时存在子节点中,并且是在子节点中所有关键字里最大(或最小)。
  • 非叶子节点仅用于索引,不保存数据记录,跟记录有关的信息都放在叶子节点中。而B树中,非叶子节点即保存索引又保存记录

优势
B+Tree查询效率更稳定,效率更高。B+树目录页只存放记录页的页号,不存放记录,这样就会使得B+Tree更加 矮胖

B树在范围查询上如果要进行排序则需要将树遍历,而B+Tree只需要遍历叶子结点(最后的记录层)
记录,这样就会使得B+Tree更加 矮胖

B树在范围查询上如果要进行排序则需要将树遍历,而B+Tree只需要遍历叶子结点(最后的记录层)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值