【MySQL】数据库索引入门介绍

索引

(1)索引是啥?

(2)索引的好处和代价?

(3)索引背后的数据结构?

1.索引是啥?

        索引顾名思义就是跟查找有关的啦~

这个查找就类似于每本书的目录!!我们通常看书的时候,不会一页一页的去往书里查找我们想要找的内容,而是通过目录来查找,然后直接定位~

所以,索引就是目录,目录就是索引

这是一个高效率的操作,没有目录,我们只能一页一页的去遍历了~遍历是低效的操作~


2.索引的好处和代价

好处就是给我们的查找提高了效率咯

但也要付出一定的代价

(1)消耗了更多空间

当你去看很厚的小说的时候,你会发现目录,同样,也好多!!!目录也要占用空间,所以索引会消耗更多的空间

(2)虽然索引提高了查询速率,但是降低了 增加,删除,修改的效率~

比如你在排版一本书的目录的时候,本来已经搞好了,这时你要删除或者增加书的一些内容,目录同样又要跟着改变~~

虽然说要付出一定的代价吧,但跟好处相比,这点代价是值得的!

因为大多数时候你都在查询,修改的频率的很低的!


3.索引背后的数据结构

既让索引那么牛逼,那么它背后的数据结构是啥样的呢?

是哈希表?还是二叉搜索树这类查询效率很高的数据结构?

答案是 B+ 树

(1)虽然哈希表的增删查改都快,都是O(1),但是哈希表因为是键值对,只能查询那种  值  相等的情况,如果是范围查找的话,那就很鸡肋了

(2)二叉搜索树,查询速度是O(n),AVL树/红黑树这种是O(logN),但如果数据库的数据特别多,那么上述树的高度会比较高

所以上面这种数据结构都不是索引背后的人,而非B+树莫属

那么想认识B+树就要先了解一下什么是B树~可以理解为B+树是B树的进阶版~


B树

B树是一个 N 叉搜索树

比如说第一个根节点可以分成N个叉,那么第一个节点可能会包含 N-1 个值,当然也可以更少

然后N-1个值可以划分N个区间,也就是N个叉

 

 这类似于高中数学分类讨论最值区间一样……

N-1个值可以划分N个区间

然后每个子节点的值是不定的,分的叉也根据值个数来划分区间

然后发现子节点的值是比上一个节点的划分的值小的值,比如说30左边的区间分出一个叉,这个叉里面的节点是 15  20  25  ,这些值都不比30大

所以当我们想查找37的时候,我们会直接找第一个节点的【30,40】区间,然后往下找到【36,38】的区间,接着就找到了37!!!

这样分成 N 个叉的意义,就是表示同样元素的数据集合时,比二叉树的高度小很多,IO次数也就降低了不少

但是吧,B树的代码实现还是很复杂的,复杂主要在于,分裂于合并~


B+树

 B+树和B树有明显的区别

(1)

B树每个节点N-1个值,分出N个区间

B+树N个值,分出N个区间

(2)

B树中的值是不会重复出现的

而B+树的值是可能重复出现的(父元素的值,会在子元素中以最大值/最小值的的状态出现)

(3)

在叶子节点这里,B+树会把所有的叶子节点,以链表的形式,首尾相连~

这个时候是非常便于范围查找的

(4)正是因为叶子节点是全集数据,只需要把每一行(每一条记录的完整的所有列关联到叶子节点即可),非叶子节点,只需要保存 索引列(只存一个id)

非叶子节点占用的空间非常小,就可以在内存中缓存,因此这个时候查询就进一步减少了硬盘IO

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值