mysql左模糊 走索引_【MySQL 原理分析】之 Explain & Trace 深入分析全模糊查询走索引的原理...

一、背景

今天,交流群有一位同学提出了一个问题。看下图:

之后,这位同学确实也发了一个全模糊查询走索引的例子:

到这我们可以发现,这两个sql最大的区别是:一个是查询全字段(select *),而一个只查询主键(select id)。

此时,又有其他同学讲了其他方案:

全文索引这个不用说,那是能让全模糊查询走索引的。但是索引覆盖这个方案,我觉得才是符合背景的:

1、因为提问的背景就是模糊查询字段是普通索引,而普通索引只查询主键就能用上覆盖索引。

2、并且背景中,就是只查询主键(ID)就显示用上索引了。

二、数据准备和场景重现

1、准备表和数据:

创建 user 表,给 phone 字段加了个普通索引:

CREATE TABLE `user` (`id` int(10) unsigned NOT NULL AUTO_INCREMENT,`name` varchar(255) DEFAULT NULL,`age` int(11) DEFAULT NULL,`phone` varchar(11) DEFAULT NULL,PRIMARY KEY (`id`),KEY `index_phone` (`phone`) USING BTREE COMMENT 'phone索引') ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

准备10万条数据意思意思:

delimiter;CREATE DEFINER=`root`@`localhost` PROCEDURE `iniData`()begindeclare i int;set i=1;while(i<=100000)doinsert into user(name,age,phone) values('测试', i, 15627230000+i);set i=i+1;end while;end;;delimiter ;call iniData();

2、执行 SQL ,查看执行计划:

explain select * from user where phone like '%156%';explain select id from user where phone like '%156%';

3、执行结果:

id

select_type

table

partitions

type

possible_keys

key

key_len

ref

rows

filtered

Extra

1

SIMPLE

user

ALL

99927

11.11

Using where

id

select_type

table

partitions

type

possible_keys

key

key_len

ref

rows

filtered

Extra

1

SIMPLE

user

index

index_phone

36

99927

11.11

Using where; Using index

我们可以发现,第二条 SQL 确实是显示用上了index_phone索引。

但是细心的同学可能会发现:possible_keys竟然为空!有猫腻。。。

我这里先说一下 prossible_keys 和 key 的关系:

1、possible_keys为可能使用的索引,而key是实际使用的索引;

2、正常是:key的索引,必然会包含在possible_keys中。

还有猫腻一点就是:使用索引和不使用索引读取的行数(rows)竟然是一样的!

三、验证和阶段性猜想

上面讲到,possible_keys和key的关系,那么我们利用正常的走索引来验证一下。

下面的 SQL, 不是全模糊查询,而是右模糊查询,保证是一定走索引的,我们分别看看此时possible_keys和key的值:

explain select id from user where phone like '156%';

执行结果:

id

select_type

table

partitions

type

possible_keys

key

key_len

ref

rows

filtered

Extra

1

SIMPLE

user

range

index_phone

index_phone

36

49963

100

Using where; Using index

这里太明显了:

1、possible_keys里确实包含了key里的索引。

2、 并且rows瞬间降到 49963,整整降了一倍,并且filtered也达到了 100。

阶段猜想:

1、首先,select id from user where phone like '%156%';因为覆盖索引而用上了索引index_phone。

2、possible_keys 为 null,证明用不上索引的树形查找。很明显,select id from user where phone like '%156%';即使显示走了索引,但是读取行数rows和select * from user where phone like '%156%';没有走索引的rows是一样的。

3、那么,我们可以猜测到,select id from user where phone like '%156%';即使因为覆盖索引而用上了index_phone索引,但是却没用上树形查找,只是正常顺序遍历了索引树。所以说,其实这两条 SQL 在表字段不多的情况下,查询性能应该差不了多少。

四、通过 Trace 分析来验证

我们分别利用 Trace 分析对于这两个 SQL 优化器是如何选择的。

1、查询全字段:

-- 开启优化器跟踪set session optimizer_trace='enabled=on';select * from user where phone like '%156%';-- 查看优化器追踪select * from information_schema.optimizer_trace;

下面我们只看 TRACE 就行了:

{"steps": [{"join_preparation": {"select#": 1,"steps": [{"expanded_query": "/* select#1 */ select `user`.`id` AS `id`,`user`.`name` AS `name`,`user`.`age` AS `age`,`user`.`phone` AS `phone` from `user` where (`user`.`phone` like '%156%')"}]}},{"join_optimization": {"select#": 1,"steps": [{"condition_processing": {"condition": "WHERE","original_condition": "(`user`.`phone` like '%156%')","steps": [{"transformation": "equality_propagation","resulting_condition": "(`user`.`phone` like '%156%')"},{"transformation": "constant_propagation","resulting_condition": "(`user`.`phone` like '%156%')"},{"transformation": "trivial_condition_removal","resulting_condition": "(`user`.`phone` like '%156%')"}]}},{"substitute_generated_columns": {}},{"table_dependencies": [{"table": "`user`","row_may_be_null": false,"map_bit": 0,"depends_on_map_bits": []}]},{"ref_optimizer_key_uses": []},{"rows_estimation": [{"table": "`user`","table_scan": {"rows": 99927,"cost": 289}}]},{"considered_execution_plans": [{"plan_prefix": [],"table": "`user`","best_access_path": {"considered_access_paths": [{"rows_to_scan": 99927,"access_type": "scan", // 顺序扫描"resulting_rows": 99927,"cost": 20274,"chosen": true}]},"condition_filtering_pct": 100,"rows_for_plan": 99927,"cost_for_plan": 20274,"chosen": true}]},{"attaching_conditions_to_tables": {"original_condition": "(`user`.`phone` like '%156%')","attached_conditions_computation": [],"attached_conditions_summary": [{"table": "`user`","attached": "(`user`.`phone` like '%156%')"}]}},{"refine_plan": [{"table": "`user`"}]}]}},{"join_execution": {"select#": 1,"steps": []}}]}

2、只查询主键

set session optimizer_trace='enabled=on';select id from user where phone like '%156%';-- 查看优化器追踪select * from information_schema.optimizer_trace;

下面我们继续只看 TRACE 就行了:

{"steps": [{"join_preparation": {"select#": 1,"steps": [{"expanded_query": "/* select#1 */ select `user`.`id` AS `id` from `user` where (`user`.`phone` like '%156%')"}]}},{"join_optimization": {"select#": 1,"steps": [{"condition_processing": {"condition": "WHERE","original_condition": "(`user`.`phone` like '%156%')","steps": [{"transformation": "equality_propagation","resulting_condition": "(`user`.`phone` like '%156%')"},{"transformation": "constant_propagation","resulting_condition": "(`user`.`phone` like '%156%')"},{"transformation": "trivial_condition_removal","resulting_condition": "(`user`.`phone` like '%156%')"}]}},{"substitute_generated_columns": {}},{"table_dependencies": [{"table": "`user`","row_may_be_null": false,"map_bit": 0,"depends_on_map_bits": []}]},{"ref_optimizer_key_uses": []},{"rows_estimation": [{"table": "`user`","table_scan": {"rows": 99927,"cost": 289}}]},{"considered_execution_plans": [{"plan_prefix": [],"table": "`user`","best_access_path": {"considered_access_paths": [{"rows_to_scan": 99927,"access_type": "scan", // 顺序扫描"resulting_rows": 99927,"cost": 20274,"chosen": true}]},"condition_filtering_pct": 100,"rows_for_plan": 99927,"cost_for_plan": 20274,"chosen": true}]},{"attaching_conditions_to_tables": {"original_condition": "(`user`.`phone` like '%156%')","attached_conditions_computation": [],"attached_conditions_summary": [{"table": "`user`","attached": "(`user`.`phone` like '%156%')"}]}},{"refine_plan": [{"table": "`user`"}]}]}},{"join_execution": {"select#": 1,"steps": []}}]}

好了,到这里我们可以发现,在 Trace 分析里面,都没显示优化器为这两个 SQL 实际选择了什么索引,而只是显示了都是用了顺序扫描的方式去查找数据。

可能唯一不同点就是:一个使用了主键索引的全表扫描,而另外一个是使用了普通索引的全表扫描;但是两个都没用上树形查找,也就是没用上 B+Tree 的特性来提升查询性能。

六、最后总结

1、当全模糊查询的 SQL 只查询主键作为结果集时,因为覆盖索引,会用上查询字段对应的索引。

2、即使用上了索引,但是却没用上树形查找的特性,只是正常的顺序遍历。

3、而正常的全表扫描也是主键索引的顺序遍历,所以说,其实这两者的性能其实是差不多的。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值