索引的底层数据结构

最新推荐文章于 2023-04-02 18:00:35 发布

静诚悟道

最新推荐文章于 2023-04-02 18:00:35 发布

阅读量1.1k

点赞数

分类专栏：面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/W2_Pan0125/article/details/100176754

版权

面试专栏收录该内容

18 篇文章 0 订阅

订阅专栏

索引的底层数据结构有：
1 树Tree，准确的说是B+树
2 Hash

时间复杂度对比：
Hash的时间O(1)
Tree的O(logn)

为什么索引采用B+树，而不采用Hash这种结构？
Hash这种结构对与获取单条记录时的查询效率是要比B+树效率要高的，
但是对与数据的范围查找效率就很低，特别是对于数据量大的时候（10万甚至百万级别的数据），
为什么低？它是根据字段值算出获取一个hash值，然后根据hash值找到在索引表中查找出hash值对应的数据行，它的索引没有按顺序存储

B+树:是一种多路平衡树，一个横向存放多个节点，并且它的非叶子节点都只存放指向子节点的索引指针，不存放数据。所有
非叶子节点都存放一个节点在叶子节点上，并且这个叶子节点是一个有序的列表结构。

当我们查一个范围数据时，通过B+树搜索

多路：一课树每个节点最多可以拥有大于2个子节点的树

平衡树：一颗树左子树和右子树保持相对平衡，不会出现一边层级特别多，一边层级特别少的情况

为什么不用二叉树？
二叉树为非平衡树，如果是有序递变的数据，很有可能就会变成左边树层级过高，或则右边树的层级过高，甚至是退化成链表。

层级过高为什么就不能用了呢？
假设是1,2,3,4,5,6这样的数据，如果我们要找到底部6这个数据，就要进行6次IO（加载磁盘数据进内存，索引是在磁盘文件中以表的形式存在的）才能找到。如果按一次IO10ms计算，60ms也不算什么。但是假设是100万呢？1001000010ms，也就是10000s，换算成分钟也就是167，所以这种结构肯定是不行的。

为什么不用红黑二叉树？
红黑二叉树一种平衡树，虽然它不会出现有一树的层级过高的情况，但是它还是没有从根本上解决树的层级问题，随着数据量增大，树的层级会越来越高。要遍历叶子节点的数据IO消耗还是过高。

为什么没有采用B树，或则说B-树？
B树虽然虽然通过多路平衡树解决了树的高度问题，但是它对与访问数据的查找效率还是低下的，对于数据访问在非叶子节点和叶子节点都有的范围，它不仅非叶子节点的遍历还需要做叶子节点的遍历。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
索引的底层数据结构

B+树
复制链接

扫一扫

专栏目录

静诚悟道 CSDN认证博客专家 CSDN认证企业博客

码龄9年

103: 原创

6万+: 周排名

95万+: 总排名

26万+: 访问

: 等级

2792: 积分

10: 粉丝

39: 获赞

22: 评论

102: 收藏

私信

关注

热门文章

分类专栏

最新评论

Sql的优化方式
CSDN-Ada助手: 如何在 SQL 中创建索引及其作用？
Mybatis二级缓存实现及原理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)增加条理清晰的目录；(3)使用更多的站内链接。
Xms Xmx含义
鱼仔灬: 我的理解是Ｘｍｓ：Extended　memory min size可扩展最小内存大小Ｘｍｘ：Extended　memory max size可扩展最大内存大小
当前服务不加入到eureka注册中心
小码哥的进阶: No instances available
idea导入非pom文件的java项目
我爱人工智能: 学习佳作，顺手点赞与关住,期待大佬回访！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。