MYSQL的IN查询效率慢的问题

最近项目的老代码又出问题了,mysql的in查询一次查询了5万个数据,cpu一下飙升到100%,这条查询sql也运行的近600s,那么是什么原因导致mysql的in查询效率如此之低,并且没有走索引呢?

1. 类型转化

select * from test_table where test_id in ();

此sql的test_id在表中是BIGINT类型,但是代码中传入的List<String>类型,有可能是类型转化的问题,导致sql没有走索引,但是经过explain排查sql之后,排除了这个可能。
原因是如果MYSQL表中的test_id字段类型是int类型的,无论传入的参数是varchar类型还是int类型都会走索引;如果MYSQL表中的test_id字段类型是varchar类型的,只有在传入的参数是int类型的才会走索引,而传入varchar类型的将不会走索引。

2. IN的取值范围较大

因为本次的查询sql的in查询的范围大约有5万条,当IN的取值范围较大时会导致索引失效,走全表扫描。
那么IN的取值范围有多少条的时候会走索引呢?
新建了一张表,test_id有索引,插入了30万的数据。
explain上述sql,发现in的取值范围在10000条以内的时候,此条查询走索引
但是一旦in的取值范围超过10000条后,将不会走索引。

3. 总结

当然在in的字段添加了索引的情况下,最终in走不走索引由mysql 优化执行器去判断,此底层逻辑较为复杂,但是在笔者的条件下,in的取值范围限制在10000条以内时,将走索引

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL中的IN子查询是一种常用的查询方式,它允许将一个查询语句嵌套在另一个查询语句的IN关键字后面。通过使用IN子查询,我们可以在查询语句中使用结果集中的数据,或者与同一张表中计算得出的数据结果进行比较。 IN子查询的优化也是一个重要的问题。在MySQL中,IN子查询的执行方式是将外表和内表进行哈希连接,而EXISTS子查询则是对外表进行循环遍历,每次循环再对内表进行查询。在查询的两个表大小相当的情况下,IN和EXISTS的效率差别不大。但如果一个表较小,另一个表较大,那么使用EXISTS子查询效率更高。此外,使用NOT IN时,内外表都要进行全表扫描,没有使用到索引;而使用NOT EXISTS的子查询则可以使用表上的索引,因此无论表大小如何,使用NOT EXISTS都比NOT IN要快。 除了IN子查询,还有其他的子查询方式可以实现类似的功能。例如,在FROM子句中使用子查询,可以将子查询作为临时的虚拟表来使用。通过给子查询取别名,并将其作为FROM子句的一部分,可以方便地在查询中使用子查询的结果,以及与其他表进行连接和比较。 综上所述,MySQL中的IN子查询是一种强大的查询工具,它可以增强SELECT查询的能力。通过了解和合理使用不同的子查询方式,我们可以更好地优化查询性能,并实现复杂的查询需求。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值