MySQL索引的使用

索引语法

1). 创建索引

CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (
index_col_name,… ) ;

2). 查看索引

SHOW INDEX FROM table_name ;

3). 删除索引

DROP INDEX index_name ON table_name ;

例如:现在又tb_user表,表字段有id、name、phone、email、profession、age、gender、status、createtime。
A. name字段为姓名字段,该字段的值可能会重复,为该字段创建索引。

CREATE INDEX idx_user_name ON tb_user(name);

B. phone手机号字段的值,是非空,且唯一的,为该字段创建唯一索引。

CREATE UNIQUE INDEX idx_user_phone ON tb_user(phone);

C. 为profession、age、status创建联合索引。

CREATE INDEX idx_user_pro_age_sta ON tb_user(profession,age,status);

D.为email建立合适的索引来提升查询效率。

CREATE INDEX idx_email ON tb_user(email);

完成上述的需求之后,我们再查看tb_user表的所有的索引数据。
在这里插入图片描述

SQL性能分析

说到了索引的使用就必定离不开性能,sqlserver提供了很多种方式查看sql性能,这里就介绍一个我觉得最好用的方式查看性能,使用explain查看sql的执行计划。
语法:

	### 直接在select语句之前加上关键字 explain / desc
EXPLAIN SELECT 字段列表 FROM 表名 WHERE 条件 ;

在这里插入图片描述
Explain 执行计划中各个字段的含义:
在这里插入图片描述

索引使用

最左前缀法则

如果索引了多列(联合索引),要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列。如果跳跃某一列,索引将会部分失效(后面的字段索引失效)以 tb_user 表为例,我们先来查看一下之前 tb_user 表所创建的索引。
在这里插入图片描述
在 tb_user 表中,有一个联合索引,这个联合索引涉及到三个字段,顺序分别为:profession,
age,status。
对于最左前缀法则指的是,查询时,最左变的列,也就是profession必须存在,否则索引全部失效。
而且中间不能跳过某一列,否则该列后面的字段索引将失效。 接下来,我们来演示几组案例,看一下
具体的执行计划:

	explain select * from tb_user where profession = '软件工程' 
	and age = 31 and status = '0';

在这里插入图片描述

	explain select * from tb_user where profession = '软件工程' and age = 31;

在这里插入图片描述

	explain select * from tb_user where profession = '软件工程';

在这里插入图片描述
以上的这三组测试中,我们发现只要联合索引最左边的字段 profession存在,索引就会生效,只不
过索引的长度不同。 而且由以上三组测试,我们也可以推测出profession字段索引长度为47、age
字段索引长度为2、status字段索引长度为5。

范围查询

联合索引中,出现范围查询(>,<),范围查询右侧的列索引失效。

	explain select * from tb_user where profession = '软件工程' 
	and age > 30 and status= '0';

当范围查询使用> 或 < 时,走联合索引了,但是索引的长度为49,就说明范围查询右边的status字
段是没有走索引的。

	explain select * from tb_user where profession = '软件工程' and age >= 30 
	and status = '0';

在这里插入图片描述
当范围查询使用>= 或 <= 时,走联合索引了,但是索引的长度为54,就说明所有的字段都是走索引
的。所以,在业务允许的情况下,尽可能的使用类似于 >= 或 <= 这类的范围查询,而避免使用 > 或 <

索引失效情况

1.不要在索引列上进行运算操作, 索引将失效。
在tb_user表中,除了前面介绍的联合索引之外,还有一个索引,是phone字段的单列索引。
在这里插入图片描述
A. 当根据phone字段进行等值匹配查询时, 索引生效。

	explain select * from tb_user where phone = '17799990015';

在这里插入图片描述
B. 当根据phone字段进行函数运算操作之后,索引失效。

	explain select * from tb_user where substring(phone,10,2) = '15';

在这里插入图片描述
2.字符串类型字段使用时,不加引号,索引将失效。
接下来,我们通过两组示例,来看看对于字符串类型的字段,加单引号与不加单引号的区别:

	explain select * from tb_user where profession = '软件工程' and age = 31 and status= '0';
	
	explain select * from tb_user where profession = '软件工程' and age = 31 and status= 0;

在这里插入图片描述

	explain select * from tb_user where phone = '17799990015';
	explain select * from tb_user where phone = 17799990015;

在这里插入图片描述
3.模糊查询
如果仅仅是尾部模糊匹配,索引不会失效。如果是头部模糊匹配,索引失效。
接下来,我们来看一下这三条SQL语句的执行效果,查看一下其执行计划:
由于下面查询语句中,都是根据profession字段查询,符合最左前缀法则,联合索引是可以生效的,
我们主要看一下,模糊查询时,%加在关键字之前,和加在关键字之后的影响。

	explain select * from tb_user where profession like '软件%';
	explain select * from tb_user where profession like '%工程';
	explain select * from tb_user where profession like '%工%';

在这里插入图片描述
4.or连接条件
用or分割开的条件, 如果or前的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会
被用到。

	explain select * from tb_user where id = 10 or age = 23;
	explain select * from tb_user where phone = '17799990017' or age = 23;

在这里插入图片描述
由于age没有索引,所以即使id、phone有索引,索引也会失效。所以需要针对于age也要建立索引。
然后,我们可以对age字段建立索引。

	create index idx_user_age on tb_user(age);

建立了索引之后,我们再次执行上述的SQL语句,看看前后执行计划的变化。
在这里插入图片描述
最终,我们发现,当or连接的条件,左右两侧字段都有索引时,索引才会生效。

5.数据分布影响
如果MySQL评估使用索引比全表更慢,则不使用索引。

	select * from tb_user where phone >= '17799990005';
	select * from tb_user where phone >= '17799990015';

在这里插入图片描述
在这里插入图片描述
经过测试我们发现,相同的SQL语句,只是传入的字段值不同,最终的执行计划也完全不一样,因为MySQL在查询时,会评估使用索引的效率与走全表扫描的效率,如果走全表扫描更快,则放弃
索引,走全表扫描。 因为索引是用来索引少量数据的,如果通过索引查询返回大批量的数据,则还不如走全表扫描来的快,此时索引就会失效。

6.覆盖索引

尽量使用覆盖索引,减少select *。 那么什么是覆盖索引呢? 覆盖索引是指 查询使用了索引,并
且需要返回的列,在该索引中已经全部能够找到 。
接下来,我们来看一组SQL的执行计划,看看执行计划的差别,然后再来具体做一个解析。
在这里插入图片描述
上述这几条SQL的执行结果为:
在这里插入图片描述
从上述的执行计划我们可以看到,这四条SQL语句的执行计划前面所有的指标都是一样的,看不出来差
异。但是此时,我们主要关注的是后面的Extra,前面两天SQL的结果为 Using where; Using
Index ; 而后面两条SQL的结果为: Using index condition 。
在这里插入图片描述

因为,在tb_user表中有一个联合索引 idx_user_pro_age_sta,该索引关联了三个字段profession、age、status,而这个索引也是一个二级索引,所以叶子节点下面挂的是这一行的主键id。 所以当我们查询返回的数据在 id、profession、age、status 之中,则直接走二级索引直接返回数据了。 如果超出这个范围,就需要拿到主键id,再去扫描聚集索引,再获取额外的数据了,这个过程就是回表。 而我们如果一直使用select * 查询返回所有字段值,很容易就会造成回表查询(除非是根据主键查询,此时只会扫描聚集索引)。
为了大家更清楚的理解,什么是覆盖索引,什么是回表查询,我们一起再来看下面的这组SQL的执行过程。

A. 表结构及索引示意图:

在这里插入图片描述

id是主键,是一个聚集索引。 name字段建立了普通索引,是一个二级索引(辅助索引)。

B. 执行SQL : select * from tb_user where id = 2;

在这里插入图片描述

根据id查询,直接走聚集索引查询,一次索引扫描,直接返回数据,性能高。

C. 执行SQL:selet id,name from tb_user where name = 'Arm';

在这里插入图片描述
虽然是根据name字段查询,查询二级索引,但是由于查询返回在字段为 id,name,在name的二级索引中,这两个值都是可以直接获取到的,因为覆盖索引,所以不需要回表查询,性能高。

D. 执行SQL:selet id,name,gender from tb_user where name = 'Arm';

在这里插入图片描述
由于在name的二级索引中,不包含gender,所以,需要两次索引扫描,也就是需要回表查询,性能相对较差一点。

7.前缀索引

当字段类型为字符串(varchar,text,longtext等)时,有时候需要索引很长的字符串,这会让索引变得很大,查询时,浪费大量的磁盘IO, 影响查询效率。此时可以只将字符串的一部分前缀,建立索引,这样可以大大节约索引空间,从而提高索引效率。
1). 语法

	create index idx_xxxx on table_name(column(n)) ;

2).前缀长度
可以根据索引的选择性来决定,而选择性是指不重复的索引值(基数)和数据表的记录总数的比值,索引选择性越高则查询效率越高, 唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。

	select count(distinct email) / count(*) from tb_user ;
	select count(distinct substring(email,1,

3). 前缀索引的查询流程
在这里插入图片描述
8.单列索引与联合索引
单列索引:即一个索引只包含单个列。
联合索引:即一个索引包含了多个列。
我们先来看看 tb_user 表中目前的索引情况:
在这里插入图片描述
在查询出来的索引中,既有单列索引,又有联合索引。
接下来,我们来执行一条SQL语句,看看其执行计划:
在这里插入图片描述
通过上述执行计划我们可以看出来,在and连接的两个字段 phone、name上都是有单列索引的,但是最终mysql只会选择一个索引,也就是说,只能走一个字段的索引,此时是会回表查询的。
紧接着,我们再来创建一个phone和name字段的联合索引来查询一下执行计划。

	create unique index idx_user_phone_name on tb_user(phone,name);

在这里插入图片描述
此时,查询时,就走了联合索引,而在联合索引中包含 phone、name的信息,在叶子节点下挂的是对
应的主键id,所以查询是无需回表查询的。
如果查询使用的是联合索引,具体的结构示意图如下:
在这里插入图片描述

索引设计原则

1). 针对于数据量较大,且查询比较频繁的表建立索引。
2). 针对于常作为查询条件(where)、排序(order by)、分组(group by)操作的字段建立索引。
3). 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高。
4). 如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引。
5). 尽量使用联合索引,减少单列索引,查询时,联合索引很多时候可以覆盖索引,节省存储空间,避免回表,提高查询效率。
6). 要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增删改的效率。
7). 如果索引列不能存储NULL值,请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时,它可以更好地确定哪个索引最有效地用于查询。

  • 7
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL索引是用于提高查询效率的一种数据结构。它可以加速数据的查找和排序操作,减少数据库的IO负载。 使用索引的好处包括: 1. 提高查询速度:索引可以将数据按照特定的顺序存储,使得数据库可以更快地定位和检索数据,从而提高查询速度。 2. 减少磁盘IO:通过使用索引,数据库可以减少磁盘IO次数,从而减少数据检索所需的时间。 3. 加速排序操作:如果查询包含了排序操作,使用索引可以加快排序速度。 4. 提高数据的唯一性约束:通过在列上创建唯一索引,可以确保列中的值是唯一的。 5. 加速连接操作:在多表连接查询中,使用索引可以加快连接操作的速度。 要正确使用MySQL索引,需要注意以下几点: 1.选择合适的列进行索引:通常选择经常用于查询条件的列作为索引列,同时需要考虑选择性,即索引列的值是否具有较高的区分度。 2. 避免过多的索引:过多的索引会增加数据库的维护成本,并且可能降低写操作的性能。 3. 避免重复和冗余索引:重复和冗余的索引不仅浪费存储空间,还会增加索引维护的成本。 4. 更新索引统计信息:MySQL会根据索引统计信息来选择使用哪个索引,因此定期更新索引统计信息是很重要的。 5. 考虑联合索引使用多列的联合索引可以提高复合条件查询的效率。 总之,合理使用索引可以显著提高MySQL数据库的查询性能和整体性能。但是需要根据具体情况进行索引的创建和维护。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值