Mysql中索引的相关问题

本文探讨了Mysql中索引的作用,分析了不同数据结构如二叉树、红黑树、Hash表和B-Tree在索引中的应用。在大数据量下,B+树因其深度最低和叶子节点间的指针而成为优选,适合范围查找。相比之下,Hash查找虽快,但不适用于范围查询。冗余索引和data元素移至叶子节点的设计是为了提高存储效率和查询性能。
摘要由CSDN通过智能技术生成

索引是帮助Mysql高效的获取数据的排好序的数据结构;
索引的数据结构:
二叉树
红黑树
Hash表
B-Tree

在这里插入图片描述
以上图为例:若使用Col2作为索引,则可以根据二叉排序树更快地寻找的数据;
但是若以Col1为索引(类似于自增/减的索引)则:

在这里插入图片描述
此时的树状结构类似于链表,因此也并没有优化数据的查询速度,和没有创建索引逐行查找没有本质上的区别;

此时若采用红黑树结构:
在这里插入图片描述
由图可见红黑树也是一种二叉平衡树;
此时虽然红黑树比二叉树有一些优化,但是当数据到达一定的量级(海量数据),红黑树的高度还是很高,效率仍是很低;(数据量越大,效率越低)

由红黑树的不足得出的思考改进:
可以在每个节点存放多个索引,则可以很好地降低树的高度;
在这里插入图片描述
B-树:
在这里插入图片描述
查找过程:每次一次性地将某个节点load到RAM中进行比较(更快);
当然一次load不能load过多的数据,Mysql规定在16KB左右;

B+树(多叉平衡树):
在这里插入图片描述

两者的比较:
1.B+树上非叶子节点上没有data,B树有;
2.B+树中每两个叶子节点之间有双向指针,B树没有;

问题1:为什么要有冗余索引,且把data元素从非叶子节点移到叶子节点呢?
将data元素移到叶子节点可以保证每个非叶子节点上横向可以存储更多的索引元素,也就意味着每个节点分叉也就更多了,因此可以保证树的深度最低;
(经大致估算,2千多万行的数据,采用B+树,树的高度为3)

问题2:为什么绝大多数情况不适用Hash查找呢?

首先需要提Hash查找,实际上Hash查找的速度比使用B+树的速度更快,但是为什么绝大多数情况不适用Hash查找呢?
看这种情况:
Select * from t where t.col1 >16;
若使用范围查找,则Hash索引并不能很好的支持范围查找;
因此绝大多数使用B+树的结构;

问题3:为什么B+树索引中的叶子节点之间有指针呢?
在这里插入图片描述
若此时想查找col1>20的元素,则在找到20之后,依次依靠指针向右获取所要的数据,极大地提高了范围查找的效率,因为叶子节点之间需要双向的指针;
(采用B树的话则需要重新返回根节点,再去查询,重复这个过程,效率很低)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值