背景
这是我工作中所遇到的真实问题,优化前sql执行时间为10秒左右,优化后为30毫秒左右,下面是背景。
需求说明 根据商品Id查询商家促销活动信息
所涉及的表
seller_promo_info 商家促销活动信息表
seller_promo_sku 促销商品表, 关键字段说明: seller_promo_info__id促销活动ID,外键,有索引。 sku__id商品Id,有索引。
优化前sql
select * from seller_promo_info
where id in (select seller_promo_info_id from seller_promo_sku where sku_id = 79337)
数据量 seller_promo_info 500万 seller_promo_sku 600万
分析
通过explain 对优化前sql进行分析,explain执行计划如下
可以清晰的看到seller_promo_info表没有走索引,进行了全表扫描,这是慢的原因。
优化方案
采用表连接的形式,sql如下
select * from seller_promo_info a JOIN (select seller_promo_info_id from seller_promo_sku where sku_id = 82) b
ON a.id = b.seller_promo_info_id
执行计划如下:
执行计划分析:
运用索引检索出seller_promo_sku的符合条件结果。
全表扫描第一步的结果虚表b,这个数据量很少,速度会很快。
因为b表数据量很少,并且表连接又用到了索引,速度极快。
优化后执行效率在30ms左右
总结
通过表连接方式进行优化,关键在于先用索引检索出数据量很少的虚表,由于虚表数据量很少再加上连接运用到了索引,所以整个sql会很快。sql优化还是要结合自身的业务场景的,如果检索虚表没有用到索引,所生成虚表数据量很大,并且连接没有走索引,我相信,我现在的优化方案是完全不可行的。