mysql 索引类型
-
主键索引 PRIMARY KEY
它是一种特殊的唯一索引,不允许有空值。一般是在建表的时候同时创建主键索引。注意:一个表只能有一个主键。 -
唯一索引 UNIQUE
唯一索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。 -
普通索引 INDEX
这是最基本的索引,它没有任何限制。 -
组合索引 INDEX
即一个索引包含多个列,多用于避免全表查询。 -
全文索引 FULLTEXT
也称全文检索,是目前搜索引擎使用的一种关键技术。
mysql 索引优化工具 EXPLAIN
举个栗子:
其实就是在查询语句前面加了EXPLAIN命令,他的打印结果就会变成下面这种样子
这里我们每列来解释有什么用
- id:选择标识符
- id相同时,执行顺序由上至下
- 如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
- id如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行
来个子查询试试效果:
EXPLAIN SELECT * FROM parking p LEFT JOIN owner o ON p.activityId = o.activityId WHERE p.buildingNum = 1
- select_type: 查询的类型
(1) SIMPLE(简单SELECT,不使用UNION或子查询等)
(2) PRIMARY(子查询中最外层查询,查询中若包含任何复杂的子部分,最外层的select被标记为PRIMARY)
(3) UNION(UNION中的第二个或后面的SELECT语句)
(4) DEPENDENT UNION(UNION中的第二个或后面的SELECT语句,取决于外面的查询)
(5) UNION RESULT(UNION的结果,union语句中第二个select开始后面所有select)
(6) SUBQUERY(子查询中的第一个SELECT,结果不依赖于外部查询)
(7) DEPENDENT SUBQUERY(子查询中的第一个SELECT,依赖于外部查询)
(8) DERIVED(派生表的SELECT, FROM子句的子查询)
(9) UNCACHEABLE SUBQUERY(一个子查询的结果不能被缓存,必须重新评估外链接的第一行)
- table: 数据库中表名称
有时不是真实的表名字,可能是简称,例如上面的p,o,也可能是第几步执行的结果的简称
- type : 访问类型
常用的类型有: ALL、index、index_merge、range、 ref、eq_ref、const、system、NULL(从左到右,性能从差到好)
ALL:Full Table Scan, MySQL将遍历全表以找到匹配的行
index: Full Index Scan,index与ALL区别为index类型只遍历索引树
index_merge: 联合索引
range:只检索给定范围的行,使用一个索引来选择行
ref: 表示上述表的连接匹配条件,即哪些列或常量被用于查找索引列上的值
eq_ref: 类似ref,区别就在使用的索引是唯一索引,对于每个索引键值,表中只有一条记录匹配,简单来说,就是多表连接中使用primary key或者 unique key作为关联条件
const、system: 当MySQL对查询某部分进行优化,并转换为一个常量时,使用这些类型访问。如将主键置于where列表中,MySQL就能将该查询转换为一个常量,system是const类型的特例,当查询的表只有一行的情况下,使用system
NULL: MySQL在优化过程中分解语句,执行时甚至不用访问表或索引,例如从一个索引列里选取最小值可以通过单独索引查找完成。
- possible_keys : 涉及到的索引
指出MySQL能使用哪个索引在表中找到记录,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用(该查询可以利用的索引,如果没有任何索引显示 null)
该列完全独立于EXPLAIN输出所示的表的次序。这意味着在possible_keys中的某些键实际上不能按生成的表次序使用。
如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查WHERE子句看是否它引用某些列或适合索引的列来提高你的查询性能。如果是这样,创造一个适当的索引并且再次用EXPLAIN检查查询
- Key : MySQL实际决定使用的键(索引),必然包含在possible_keys中
如果没有选择索引,键是NULL。要想强制MySQL使用或忽视possible_keys列中的索引,在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。
- key_len 索引中使用的字节数
可通过该列计算查询中使用的索引的长度(key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的),不损失精确性的情况下,长度越短越好
- ref : 列与索引的比较
列与索引的比较,表示上述表的连接匹配条件,即哪些列或常量被用于查找索引列上的值
- rows: 估算出结果集行数
表示MySQL根据表统计信息及索引选用情况,估算的找到所需的记录所需要读取的行数
- Extra: 该列包含MySQL解决查询的详细信息
有以下几种情况:
-
Using where:不用读取表中所有信息,仅通过索引就可以获取所需数据,这发生在对表的全部的请求列都是同一个索引的部分的时候,表示mysql服务器将在存储引擎检索行后再进行过滤
-
Using temporary:表示MySQL需要使用临时表来存储结果集,常见于排序和分组查询,常见 group by ; order by
-
Using filesort:当Query中包含 order by 操作,而且无法利用索引完成的排序操作称为“文件排序”
-
Using join buffer:改值强调了在获取连接条件时没有使用索引,并且需要连接缓冲区来存储中间结果。如果出现了这个值,那应该注意,根据查询的具体情况可能需要添加索引来改进能。
-
Impossible where:这个值强调了where语句会导致没有符合条件的行(通过收集统计信息不可能存在结果)。
-
Select tables optimized away:这个值意味着仅通过使用索引,优化器可能仅从聚合函数结果中返回一行
-
No tables used:Query语句中使用from dual 或不含任何from子句
mysql 索引实战优化
- 我们先来看看没有用到索引的情况
EXPLAIN select * from parking where remark = "no exist"
我们看到type的类型是ALL, 然后所需要读取的行数是1840行,但是结果集其实是0行, 这就是全表扫描
- 我们再来看看使用了索引后的情况
EXPLAIN select * from parking where activityId = 882412923459207168
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y08irSQz-1595325775984)(https://upload-images.jianshu.io/upload_images/17317532-81870c55401ea3aa.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]
我们看到type的类型变为ref, 然后所需读取的行数是460行, 这460行就是结果集,所以索引的效率会高效很多
- 接下来我们看看groupby的情况
// group by 有索引字段
EXPLAIN select activityId from parking GROUP BY activityId;
// group by 无索引字段
EXPLAIN select remark from parking GROUP BY remark;
// group by 包含无索引字段
EXPLAIN select activityId from parking GROUP BY activityId, remark;
我们来看看结果
group by 有索引字段
group by 无索引字段
group by 包含无索引字段
- 再来我们来看看mysql重整语句的效果
我们来看第一条语句
EXPLAIN select * from parking where remark = "no exist" AND activityId = 882412923459207168;
EXPLAIN select * from parking where activityId = 882412923459207168 AND remark = "no exist" ;
上面两条的语句的执行结果都是:
表示mysql会帮我们重整And语句,把有索引的字段提到最左边,先查询
- 那OR语句又如何呢
EXPLAIN select * from parking where remark = "no exist" OR activityId = 882412923459207168;
EXPLAIN select * from parking where activityId = 882412923459207168 OR remark = "no exist" ;
上面两条的语句的执行结果都是:
我们可以发现,无论顺序如何,只要包含未索引字段都会全表查询
- 联合索引
首先我们把原本的单个索引修改成联合索引
然后我们再跑一下以上面我们查询过的语句
EXPLAIN select * from parking where buildingNum = 1;
EXPLAIN select * from parking where activityId = 882412923459207168;
第一条查询走了索引,索引类型是combindIndex
但是第二条我们发现走的是全表查询
这里就涉及到组合索引遵循最左前缀规则,就是是否使用索引,从最左边的字段开始匹配, 同时遇到范围查询(>、<、between、like)就会停止匹配,下面我们再来看几个例子
EXPLAIN select * from parking where activityId = 882412923459207168 AND buildingNum = 1;
EXPLAIN select * from parking where buildingNum = 1 AND activityId = 882412923459207168;
EXPLAIN select * from parking where itemKey = 'owner:882412924532948992' AND activityId = 882412923459207168;
第一条查询和第二条查询都用到了索引,这是mysql重整语句的效果
但是第三条走的是全表搜索, 原因是就算重整语句,也没能匹配最左边的‘buildingNum’字段,不符合联合索引
我们再来看看范围查询又如何
EXPLAIN select * from parking where buildingNum > 10 AND buildingNum < 100 and activityId > 882412923459207168;
多个列同时进行范围查找时,只有对索引最左边的那个列进行范围查找才用到B+树索引,也就是只有 buildingNum 用到索引,在10<buildingNum<100的范围内activityId是无序的,不能用索引,找到10<buildingNum<100的记录后,只能根据条件 activityId > 882412923459207168继续逐条过滤
EXPLAIN select * from parking where buildingNum = 1 and activityId > 882412923459207168;
这种范围查询走的就是联合索引
- 总结
- EXPLAIN 这种能看到查询语句的执行过程,从而优化语句,所以有事没事可以用EXPLAIN来测试下查询语句是否使用了索引
- 只要列中包含有NULL值都将不会被包含在索引中,复合索引中只要有一列含有NULL值,那么这一列对于此复合索引就是无效的。所以我们在数据库设计时不要让字段的默认值为NULL。
- 一般情况下不鼓励使用like操作,如果非使用不可,如何使用也是一个问题。like “%aaa%” 不会使用索引而like “aaa%”可以使用索引。
- MySQL查询只使用一个索引,因此如果where子句中已经使用了索引的话,那么order by中的列是不会使用索引的。因此数据库默认排序可以符合要求的情况下不要使用排序操作;尽量不要包含多个列的排序,如果需要最好给这些列创建复合索引
更多demo请关注
springboot demo实战项目
java 脑洞
java 面试宝典
开源工具
#公众号
五分钟了解前沿技术,大数据,微服务,区域链,提供java前沿技术干货,独立游戏制作技术分享
如果这篇文章对你有帮助请给个star