MySql 中的聚簇索引、非聚簇索引、唯一索引和联合索引

目录

一. 前言

二. 聚簇索引和非聚簇索引

三. 覆盖索引

四. 联合索引

4.1. 原理讲解

4.2. 最左前缀匹配原则

4.3. 索引下推

五. 唯一索引


一. 前言

    索引根据底层实现可分为 B-Tree 索引和哈希索引,大部分时候我们使用的都是 B-Tree 索引,因为它良好的性能和特性更适合于构建高并发系统。

    根据索引的存储方式来划分,索引可以分为聚簇索引非聚簇索引。聚簇索引的特点是叶子节点包含了完整的记录行,而非聚簇索引的叶子节点只有所以字段和主键ID。

    根据聚簇索引和非聚簇索引还能继续下分,分为普通索引、覆盖索引、唯一索引以及联合索引等。

二. 聚簇索引和非聚簇索引

    聚簇索引也叫聚集索引,它实际上并不是一种单独的索引类型,而是一种数据存储方式,聚簇索引的叶子节点保存了一行记录的所有列信息。也就是说,聚簇索引的叶子节点中,包含了一个完整的记录行。

    非聚簇索引也叫非聚集索引、辅助索引、普通索引,它的叶子节点只包含一个主键值,通过非聚簇索引查找记录要先找到主键,然后通过主键再到聚簇索引中找到对应的记录行,这个过程被称为回表

例如一个包含了用户姓名和年龄的的数据表,假设主键是用户 ID,聚簇索引的结构为(橙色的代表 id,绿色是指向子节点的指针):

叶子节点中,为了突出记录,把 id、name、age 区分开来了,实际上是连在一起的,它们是构成一条记录的整体。

而一个非聚簇索引(以 age 为索引)的结构是:

它的叶子节点中,不包含整个记录的完整信息,除了 age 字段本身以外,只包含当前记录的主键id。如果想要获取整行记录数据还需要再通过 id 号到聚簇索引中回表查询。

InnoDB 中,每个表必须有一个聚簇索引,默认是根据主键建立的。如果表中没有主键,InnoDB 会选择一个合适的列作为聚簇索引,如果找不到合适的列,会使用一列隐藏的列 DB_ROW_ID 作为聚簇索引。

三. 覆盖索引

    非聚簇索引中因为不含有完整的数据信息,查找完整的数据记录需要回表,所以一次查询操作实际上要做两次索引查询。而如果所有的索引查询都要经过两次才能查到,那么肯定会引起效率下降,毕竟能少查一次就少查一次。

以上面的 age 索引为例,它是一个非聚簇索引,如果我想通过年龄查询用户的 id,执行了下面一条语句:

SELECT id FROM userinfo WHERE age = 10;

这种情况是否还有必要去回表?因为我只需要 id 的值,通过 age 这个索引就已经能拿到 id 了,如果还去回表一次不就做了无用的操作了吗?实际上确实是不需要的。索引查询中,如果辅助索引已经能够得到查询的所有信息了,就无需再回表,这个就是覆盖索引。

四. 联合索引

4.1. 原理讲解

    联合索引指的是同时对多列创建的索引,创建联合索引后,叶子节点会同时包含每个索引列的值,并且同时根据多列排序,这个排序和我们所理解的字典序类似。

例如对同时对上面的姓名和年龄创建的索引结构:

每个叶子节点同时保存了所有的索引列(name、age 都是简写,没有用真实数据替换),除此之外,还是只包含了主键 id。

4.2. 最左前缀匹配原则

    当对多列创建索引后,并不是只要包含了创建索引的列就能使用索引,索引的使用要遵循最左前缀匹配原则。

假设对列(A、B、C)创建索引,那么只有以下场景能使用索引:

  1. 对列(A、B、C)或者(A、C)或者(A、B)进行查询会匹配索引,对(C、A)或者(B、C)来说不能使用索引。
  2. 通配符只能使用 LIKE 'val%' 形式,不能使用 LIKE '%VAL%',后者会导致全表扫描
  3. 索引列不能进行运算,例如 WHERE A + 1 = 5 这种场景会导致索引失效。
  4. 索引列不能包含范围值查询,如 LIKE、BETWEEN、>、< 等都会导致后面的列无法匹配索引。
  5. 索引列不能包含有 NULL 值。

4.3. 索引下推

    新版本的 MySql(5.6以上)中引入了索引下推的机制:可以在索引遍历过程中,对索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数。

例如针对上面表中的(name、age)做联合索引,正常情况下的查询逻辑:

  1. 通过 name 找到对应的主键 ID;
  2. 根据 id 记录的列匹配 age 条件。

这种做法会导致很多不必要的回表,例如表中存在(张三、10)和(张三、15)两条记录,此刻要查询(张三、20)的记录。查询时先通过张三定位到所有符合条件的主键 ID,然后在聚簇索引中遍历满足条件的行,看是否有符合 age = 20 的记录。实际情况是没有满足条件的记录的,这个回表过程也相当于是在做无用之功。

索引下推的主要功能就是改善这一点,在联合索引中,先通过姓名和年龄过滤掉不用回表的记录,然后再回表查询索引,减少回表次数。

五. 唯一索引

    唯一索引是一种不允许具有相同索引值的索引,系统在创建该索引时检查是否有重复的键值,每次对更新或增加记录时都会检查这一点。主键索引就是唯一索引。

事实上,MySql 的唯一限制和主键限制都是通过索引实现的。

  • 19
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
MySQL聚簇索引是将索引和数据存储在同一个文件的索引类型。聚簇索引的叶子节点存放的是整张表的行记录数据,也被称为数据页。而聚簇索引则是将索引文件和数据文件分开存储的。在一张表上最多只能创建一个聚簇索引,因为真实数据的物理顺序只能有一种。 要建立MySQL聚簇索引,可以使用CREATE INDEX语句并指定CLUSTERED关键字。例如,下面的示例演示了如何为表的某个列建立聚簇索引: CREATE CLUSTERED INDEX index_name ON table_name (column_name); 其,index_name表示聚簇索引的名称,table_name表示表的名称,column_name表示要建立聚簇索引的列名。 需要注意的是,聚簇索引的建立会对插入和更新操作的性能产生影响,因此在使用聚簇索引时需要全面衡量。可以根据具体的需求和查询模式来选择是否使用聚簇索引。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Mysql聚簇索引](https://blog.csdn.net/qq_37933128/article/details/127186227)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [详解MySQL 聚簇索引聚簇索引](https://download.csdn.net/download/weixin_38667849/13682520)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

流华追梦

你的鼓励将是我创作最大的动力。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值