面试高频:MySQL索引

1 概念

索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引, 并指定索引的类型,各类索引有各自的数据结构实现。(具体细节在后续的数据库原理课程讲解)

2 作用

数据库中的表、数据、索引之间的关系,类似于书架上的图书、书籍内容和书籍目录的关系。

索引所起的作用类似书籍目录,可用于快速定位、检索数据。

索引对于提高数据库的性能有很大的帮助。 

3 使用场景

要考虑对数据库表的某列或某几列创建索引,需要考虑以下几点:

  1. 数据量较大,且经常对这些列进行条件查询
  2. 该数据库表的插入操作,及对这些列的修改操作频率较低
  3. 索引会占用额外的磁盘空间

满足以上条件时,考虑对表中的这些字段创建索引,以提高查询效率。

反之,如果非条件查询列,或经常做插入、修改操作,或磁盘空间不足时,不考虑创建索引

4 使用

创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建 对应列的索引。

查看索引

show index from 表名;

案例:查看学生表已有的索引

show index from student;

PRIMARY 是主键自动生成的索引(不需要手动输入,只要建表的时候,指定了主键,就会自动生成主键索引)

创建索引

对于非主键、非唯一约束、非外键的字段,可以创建普通索引

create index 索引名 on 表名(字段名);

案例:创建班级表中,name字段的索引

 create index idx_classes_name on classes(name);

温馨提示:

创建索引,也是一个“危险操作”

如果是针对空表,或者表中的数据比较少(几千,几万 .... )创建索引,就谈不上危险不危险.

一旦表的数据量比较大,千万级别 ..... 此时创建索引操作,就可能会触发大量的硬盘IO,直接把机器就搞的卡死住了 .....

在最初建表的时候,都要有哪些索引,提前规划好,创建好 .....

万一某个表,确实没有提前创建索引,现在又有了很多数据了,非加索引不可,此时咋办呢 ??

删除索引

drop index 索引名 on 表名;

案例:删除班级表中name字段的索引

drop index idx_classes_name on classes;

只能删除,咱们自己创建的索引.不能删除 自动生成的

删除索引,也是危险操作 !!!要能够慎重对待 ~~

5.数据库索引

二叉搜索树和哈希表,都不适合给 数据库 做索引.

1)二叉搜索树

最大的问题在于“二叉”当要保存的元素多的时候,就会使整个树的高度变的比较高~

一旦高度高了,比较次数就会变多 ~~硬盘上 ~~

2)哈希表

最大的问题在于,只能进行“相等”查询.无法进行><这样的”范围查询”,也无法进行like
模糊查询.

3)B+树

为数据库量身定做的数据结构 ~~

这里主要的目的,不是为了减少比较的次数,而是要减少 硬盘IO的次数.

非叶子节点,只需要存储key值,不需要存储数据行,消耗空间不大

1)不同于B树.
B树是有N个key,划分成N+1个区间

B+树是有N个key,划分出N个区间~

2)父节点中的key的值,会在下面的子节点中再次出现 ~~ (以子节点中的最大值的身份)

重复出现的做法,看起来好像是浪费空间
实际上非常有用 ~~

  1. 快速查找:重复键可以帮助加速查找操作。由于父节点中的键是子节点中键的最大值,能够有效地引导搜索路径。

  2. 范围查询:在进行范围查询时,父节点的键可以帮助快速定位到包含范围的子节点,从而加速范围查询的过程。

  3. 一致性:这种做法有助于保持树的平衡和一致性,使得所有节点都能保持相同的结构,简化插入和删除操作。

虽然这种重复看起来像是浪费空间,但实际上它为高效的查找和查询操作提供了很大的帮助。

3)B+树把叶子结点,像链表一样首尾相连了 ~~
此时,进行“范围查询”就会非常方便 !!!

B+树的优势

1.N叉搜索树,高度比较低,此时硬盘IO次数就比较少.
2.叶子结点是全集,并且用链表结构连接,非常便于范围查询 ~~

3.B+树,所有的查询都是要落到叶子结点上完成的 ~~ 任何一次查询,经历的IO次数和比较次数都是差不多的,查询的开销稳定的 ~~

4.由于B+树,叶子结点是全集,非叶子节点上不必存储“数据行”,只需要存储索引列的key即可.
使得非叶子节点,消耗的空间比较少 ~~

6.面试模拟

谈谈对于数据库索引的理解 ~~

如果能连续讲30分钟,基本上就稳了 !!!
最关键的是,能否有某个点,打动面试官 ~~

1)索引是啥,解决啥问题的~

索引相当于书的目录,能够提高查询的速度

2)索引付出了什么代价
a)需要更多的存储空间
b)可能会影响增删改的效率(不是一定会影响)
整体来说,索引利大于弊,日常开发还是会经常使用的.

3)如何使用sql 操作索引,是否有注意事项

a) show index from表名;查看索引 (主键,外键,unique,会自动生成索引)

b) create index 索引名 on表名(列名)
c)drop index 索引名 on表名;

4)索引背后的数据结构=>B+树特点和优势 .-

特点:
a)N叉搜索树,每个节点上包含N个key,划分出N个区间.
b)每个父节点中的元素,都会下沉到子节点中,作为该子节点中最大值的角色来存在.
c)叶子结点这一层就构成了数据集合的全集 ~~
d)使用类似于链表这样的结构,把叶子结点串起来.

优势
a)N叉搜索树,高度比较低,降低了硬盘IO次数
b)范围查询非常方便&高效
c)所有的查询都落到叶子结点上,开销非常稳定.容易预估成本.
d)叶子结点存储数据行,非叶子节点只存储索引列的key值,非叶子节点占据空间小,可以加载到内存中
进一步的减少查询时IO的访问次数.

 

如果您觉得有失偏颇请您在评论区指正,如果您觉得不错的话留个好评再走吧!!

您的鼓励就是对我最大的支持!  ! !

  • 11
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值