背景
这是我工作中所遇到的真实问题,优化前sql执行时间为10秒左右,优化后为30毫秒左右,下面是背景。
-
需求说明 根据商品Id查询商家促销活动信息
-
所涉及的表
seller_promo_info 商家促销活动信息表seller_promo_sku 促销商品表, 关键字段说明: seller_promo_info__id促销活动ID,外键,有索引。 sku__id商品Id,有索引。
-
优化前sql
select * from seller_promo_info
where id in (select seller_promo_info_id from seller_promo_sku where sku_id = 79337)
- 数据量 seller_promo_info 500万 seller_promo_sku 600万
分析
通过explain 对优化前sql进行分析,explain执行计划如下
可以清晰的看到seller_promo_info表没有走索引,进行了全表扫描,这是慢的原因。
优化方案
采用表连接的形式,sql如下
select * from seller_promo_info a JOIN (select seller_promo_info_id from seller_promo_sku where sku_id = 82) b
ON a.id = b.seller_promo_info_id
执行计划如下:

执行计划分析:
- 运用索引检索出seller_promo_sku的符合条件结果。
- 全表扫描第一步的结果虚表b,这个数据量很少,速度会很快。
- 因为b表数据量很少,并且表连接又用到了索引,速度极快。
优化后执行效率在30ms左右
总结
通过表连接方式进行优化,关键在于先用索引检索出数据量很少的虚表,由于虚表数据量很少再加上连接运用到了索引,所以整个sql会很快。sql优化还是要结合自身的业务场景的,如果检索虚表没有用到索引,所生成虚表数据量很大,并且连接没有走索引,我相信,我现在的优化方案是完全不可行的。
本文分享了在高数据量下,如何将商品Id查询商家促销活动信息的SQL执行时间从10秒优化至30毫秒。通过分析执行计划,发现原SQL未充分利用索引导致全表扫描,改用表连接方式,先检索少量数据的虚表,再利用索引连接,大幅提高查询效率。

被折叠的 条评论
为什么被折叠?



