“NOT_IN”与“NULL”的邂逅

今天处理了一个因“NOT IN”NULL邂逅导致的问题,值得思考和总结,记录在此,供参考。(感谢John抛出的问题)
我们以实验的形式先再现一下这个问题,然后对其分析,最后给出几种解决方案。

1.
创建实验表T,并分别初始化三条数据,注意T2表中包含一条空(NULL)数据。
sec@ora10g> insert into t1 values (1);
sec@ora10g> insert into t1 values (2);
sec@ora10g> insert into t1 values (3);

sec@ora10g> insert into t2 values (1);
sec@ora10g> insert into t2 values (null);
sec@ora10g> insert into t2 values (3);

sec@ora10g> commit;

2.
确认T1表和T2表的数据内容
sec@ora10g> select * from t1;

         X
----------
         1
         2
         3

sec@ora10g> select * from t2;

         X
----------
         1

         3

3.
再现问题
尝试使用“NOT IN”方法获得不在T2表中出现的T1表数据。
sec@ora10g> select * from t1 where x not in (select x from t2);

no rows selected

问题已重现,明明T1中的数据“2”T2表中没有,为什么没有返回结果呢?
原因:当子查询返回含有“NULL”记录时,使用NOT IN时将不会有返回记录。
解析:可以这么理解这个现象:Oracle中的NULL是一个不确定的状态。以T1表中的记录“2”为例,在与T2表中的NULL进行比较时,NULL既可以是“2”,也可以不是“2”,因为判断不了他们的关系,所以只能返回空记录,此乃无奈之举。

4.
为什么使用“IN”可以返回正确的结果?
sec@ora10g> select * from t1 where x in (select x from t2);

         X
----------
         1
         3

这是显然的,因为T2表中确确实实的存在着记录“1”和记录“3”,因此“1”“3”被返回。不过,注意,NULL依然是一个不确定的状态,因此在T1表中的“2”NULL比较之后仍然是个不确定的结果,因此“2”是不会被返回的。这里给我们的一个错觉:T1表中的“2”T2表中NULL不同(他们其实也可能相同)。

5.
诸多解决方案
1
)排除“NOT IN”子查询中存在的NULL
sec@ora10g> select * from t1 where x not in (select x from t2 where x is not null);

         X
----------
         2

2
)使用“NOT EXISTS改写
sec@ora10g> select * from t1 where not exists (select * from t2 where t1.x=t2.x);

         X
----------
         2

3
)使用外连接改写
sec@ora10g> select t1.* from t1, t2 where t1.x = t2.x(+) and t2.x is null;

         X
----------
         2

道理是相通的,想想为什么使用“NOT EXISTS”外连接方法改写后就可以成功?(给大家一个机会,这里不赘述。)

6.
小结
这里描述的的案例可以用陷阱来形容,不过对于这个陷阱我们是有诸多解决方案进行规避的。
遇到问题在沉着、冷静+淡定之后,终有柳暗花明之时。希望您也有思考之后豁然开朗之悦。

Good luck.

secooler
10.02.09

-- The End --

=========================================

IN & NOT IN & EXISTS & NOT EXISTS & TABLE JION

当子查询有返回null值时,not in不会有结果返回,如:

SQL> select ename from emp where deptno not in(10,20,null)
2 /

no rows selected

原因是:

deptno not in(10, 20, null) ===>

not (deptno in(10, 20, null)) ===>

not (deptno=10 or deptno=20 or deptno=null) ===>

deptno<>10 and deptno<>20 and deptno<>null ===>

deptno<>10 and deptno<>20 and unkown ===>

deptno<>10 and deptno<>20 and false ===>false


 

下面是两个在NOT IN中使用子查询的例子,先看没有null的情况:

SQL> select ename, deptno from emp;

ENAME DEPTNO
---------- ----------
SMITH 20
ALLEN 30
WARD 30
JONES 20
MARTIN 30
BLAKE 30
CLARK 10
SCOTT 20
KING 10
TURNER 30
ADAMS 20
JAMES 30
FORD 20
MILLER 10

14 rows selected.

SQL> select dname from dept where deptno not in(select deptno from emp);

DNAME
--------------
OPERATIONS

再看子查询包含null值的情况:

SQL> insert into emp(empno, ename,deptno)
2 values(9999,'LAW',null)
3 /

1 row created.

SQL> select ename, deptno from emp;

ENAME DEPTNO
---------- ----------
LAW
SMITH 20
ALLEN 30
WARD 30
JONES 20
MARTIN 30
BLAKE 30
CLARK 10
SCOTT 20
KING 10
TURNER 30
ADAMS 20
JAMES 30
FORD 20
MILLER 10

15 rows selected.
SQL> select dname from dept where deptno not in(select deptno from emp);

no rows selected

SQL> select dname from dept
2 where deptno not in(select deptno from emp where deptno is not null)
3 /

DNAME
--------------
OPERATIONS

而子查询包含null时,用in却不会有问题:

SQL> select ename,deptno from emp where deptno in(10,20,null)
2 /

ENAME DEPTNO
---------- ----------
SMITH 20
JONES 20
CLARK 10
SCOTT 20
KING 10
ADAMS 20
FORD 20
MILLER 10

8 rows selected.

IN一般可以改为EXISTS:

SQL> select dname from dept
2 where deptno in(select deptno from emp)
3 /

DNAME
--------------
RESEARCH
SALES
ACCOUNTING


SQL> select dname from dept
2 where exists(select * from emp where emp.deptno=dept.deptno)
3 /

DNAME
--------------
RESEARCH
SALES
ACCOUNTING

而NOT IN一般可以改为NOT EXISTS:

SQL> select dname from dept
2 where deptno not in(select deptno from emp where deptno is not null)
3 /

DNAME
--------------
OPERATIONS

SQL> select dname from dept
2 where not exists(select * from emp where dept.deptno=emp.deptno)
3 /

DNAME
--------------
OPERATIONS

使用NOT EXISTS,即使子查询中包含NULL值,也会得到正确结果。原因是:

select * from emp where dept.deptno=null不会有返回值,这样,EXISTS(select * from emp where dept.deptno=null)返回的布尔值为false,而 NOT(false)显然为TRUE,其他条件与之作and后,依然得到true。

而在NOT IN子句中,是NOT(deptno=null),即NOT(unkown),结果依然为unkown,而unkown被当作false,其他条件与之作and后,最后得到false。

NOT EXISTS(select * from emp where dept.deptno=null) ===>

NOT (false) ===>TRUE

所以子查询中的null不会影响其他的查询结果。

EXISTS可以改为使用表连接语法:

SQL> select dname from dept
2 where exists(select * from emp where emp.deptno=dept.deptno)
3 /

DNAME
--------------
RESEARCH
SALES
ACCOUNTING

SQL> select distinct dname from dept,emp
2 where dept.deptno=emp.deptno
3 /

DNAME
--------------
ACCOUNTING
RESEARCH
SALES

修改为表连接语法后,性能会有所提高,而且可以在select子句中查询另外一个表中的列。

EXISTS还可以改为使用count(*),因为这时对于每个dept表中的deptno要遍历整个emp表,很明星性能会差:

SQL> select dname from dept
2 where (select count(*) from emp where emp.deptno=dept.deptno)>0
3 /

DNAME
--------------
ACCOUNTING
RESEARCH
SALES

NOT EXISTS可以修改为outer join:

SQL> select dname from dept
2 where not exists(select * from emp where emp.deptno=dept.deptno)
3 /

DNAME
--------------
OPERATIONS

SQL> select dname from dept
2 left outer join emp on dept.deptno=emp.deptno
3 where emp.deptno is null
4 /

DNAME
--------------
OPERATIONS

where emp.deptno is null是左外连接的结果中的emp.deptno为null,而不是指原来的emp表。

EXISTS与NOT EXISTS改为表连接语法后,性能一般都会提高。

下一步再研究这几种语法在执行计划上的差别:

IN与EXISTS的执行计划相同,与table join稍有区别。

NOT EXISTS与左外连接的执行计划相同,与NOT IN稍有区别。

有待于进一步研究其效率上的差异。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/11320622/viewspace-675486/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/11320622/viewspace-675486/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值