SQL开发中为什么要尽量避免使用 IN 和 NOT IN 呢？

最新推荐文章于 2023-08-22 11:38:02 发布

独行侠梦

最新推荐文章于 2023-08-22 11:38:02 发布

阅读量381

点赞数 1

文章标签：单元测试腾讯 java mysql 数据库

原文链接：https://mp.weixin.qq.com/s?__biz=MzU2NDc4MjE2Ng==&mid=2247492484&idx=1&sn=bdbdb8162c77a091c8c385060aebc3da&chksm=fc4716bdcb309fab830dd47d5b9cc37c8f0ca3b7679ab0e6d6b6ef23d5e3dc70f92aa59f897d&scene=126&&sessionid=0

版权

本文探讨了在SQL查询中避免使用IN和NOT IN的原因，主要由于它们可能导致效率低下和查询错误。通过实例展示了当IN和NOT IN无法命中索引以及在处理空值时可能出现的问题。建议使用EXISTS和NOT EXISTS，或者JOIN操作来替代，以提高查询效率和准确性。同时，给出了具体的转换示例。

摘要由CSDN通过智能技术生成

WHY？
- 1、效率低
- 2、容易出现问题，或查询结果有误（不能更严重的缺点）
HOW？
- 1、用 EXISTS 或 NOT EXISTS 代替
- 2、用JOIN 代替

WHY？

IN 和 NOT IN 是比较常用的关键字，为什么要尽量避免呢？

1、效率低

项目中遇到这么个情况：

t1表和 t2表都是150w条数据，600M的样子，都不算大。

但是这样一句查询 ↓

select * from t1 where phone not in (select phone from t2)

直接就把我跑傻了。。。十几分钟，检查了一下 phone在两个表都建了索引，字段类型也是一样的。原来not in 是不能命中索引的。。。。

改成 NOT EXISTS 之后查询 20s ，效率真的差好多。

select * from t1 
where  not  EXISTS (select phone from t2  where t1.phone =t2.phone)

2、容易出现问题，或查询结果有误（不能更严重的缺点）

以 IN 为例。建两个表：test1 和 test2

create table test1 (id1 int)
create table test2 (id2 int)

insert into test1 (id1) values (1),(2),(3)
insert into test2 (id2) values (1),(2)

我想要查询，在test2中存在的 test1中的id 。使用IN的一般写法是：

select id1 from test1 
where id1 in (select id2 from test2)

结果是：

图片

OK 木有问题！

但是如果我一时手滑，写成了：

select id1 from test1 
where id1 in (select id1 from test2)

不小心把id2写成id1了，会怎么样呢?

结果是：

图片

EXCUSE ME！为什么不报错？

单独查询 select id1 from test2 是一定会报错: 消息 207，级别 16，状态 1，第 11 行列名 'id1' 无效。

然而使用了IN的子查询就是这么敷衍，直接查出 1 2 3

这仅仅是容易出错的情况，自己不写错还没啥事儿，下面来看一下 NOT IN 直接查出错误结果的情况：

给test2插入一个空值：

insert into test2 (id2) values (NULL)

我想要查询，在test2中不存在的 test1中的id 。

select id1 from test1 
where id1 not in (select id2 from test2)

结果是：

图片

空白！显然这个结果不是我们想要的。我们想要3。为什么会这样呢？

原因是：NULL不等于任何非空的值啊！如果id2只有1和2，那么3<>1 且 3<>2 所以3输出了，但是 id2包含空值，那么 3也不等于NULL 所以它不会输出。

跑题一句：建表的时候最好不要允许含空值，否则问题多多。

HOW？

1、用 EXISTS 或 NOT EXISTS 代替

select *  from test1 
   where EXISTS (select * from test2  where id2 = id1 )

select *  FROM test1  
 where NOT EXISTS (select * from test2  where id2 = id1 )

2、用JOIN 代替

select id1 from test1 
   INNER JOIN test2 ON id2 = id1 
   
 select id1 from test1 
   LEFT JOIN test2 ON id2 = id1 
   where id2 IS NULL

妥妥的没有问题了！

PS：那我们死活都不能用 IN 和 NOT IN 了么？并没有，一位大神曾经说过，如果是确定且有限的集合时，可以使用。如 IN （0，1，2）。

往期推荐

有赞团队：SaaS公司的系统稳定与安全机制，附Saas研报

腾讯开源运维 PaaS 平台

你知道阿里规范为什么在 @Transactional 事务注解中指定 rollbackFor吗？

项目经理：注释不要乱写，这套IDEA 注释模板拿去用

不重启项目，SpringBoot如何实现动态修改定时任务？

java服务端如何防止重复支付

java开发到底要不要单元测试，如何正确进行单元测试？

产品需求：用java做一个长链接转短链的微服务

独行侠梦

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

SQL开发中为什么要尽量避免使用 IN 和 NOT IN 呢？

WHY？

1、效率低

2、容易出现问题，或查询结果有误 （不能更严重的缺点）

HOW？

1、用 EXISTS 或 NOT EXISTS 代替

2、用JOIN 代替

2、容易出现问题，或查询结果有误（不能更严重的缺点）