like查询后置% 索引竟然也失效_like 以%结尾会导致索引失效吗?-CSDN博客

本文链接：https://blog.csdn.net/weixin_45157630/article/details/90766877

背景

昨天早上接到一个任务，查询某类商品，数据库用的是mysql，版本是5.6.37，es_product 表数据不多，两万多条。执行语句我简化了一下，类似下面的这条sql：

SELECT * FROM es_product WHERE goods_code LIKE 'meiju%';

goods_code是建了索引的，它的值是由类型名称拼音+’_’+编码组成（这里是导致后面问题的关键），索引类型Normal。
语句执行的很慢，我们看下它的执行计划是什么：

EXPLAIN
SELECT * FROM es_product WHERE goods_code LIKE 'meiju%'

在这里插入图片描述
正常情况下模糊查询%后置索引是有效的，%前置的话，会导致索引失效。

可能导致的原因

因为它的值是由类型名称拼音+’_’+编码组成，所以想到的就是字段值的区分度以及重复率，区分度太小或重复率过高会使索引失效，进而走全表扫描。

例如性别字段，它一般就男，女，这就不建议建立索引了，区分度大小了。

es_product 总的数据量：24426
meiju字符串长度为5，我们就来看看长度为5的字符串的重复率：
执行下面的sql：

SELECT (count(*) / 24426 ) percent,count(*) cnt,LEFT(goods_code,5) prefix
FROM es_product GROUP BY prefix ORDER BY percent DESC LIMIT 0,10

在这里插入图片描述
可以看到，前缀为meiju的重复率竟然占到了0.268，区分度大小了，mysql选择了全表扫描。
我们来试试百分比为0.0135前缀为LEBAZ的执行计划

type=range，索引范围扫描。由此可见当重复率高到某个百分比值时，mysql会走全表扫描
后面我继续增大LEFT(str,length)函数中截取的length的大小，观察重复率。
在这里插入图片描述
在索引生效的情况，取到了本次实验重复率的最大值0.1022，前缀为liber-V，长度是7，
我们来看下它的执行计划：