mysql中的in与exists区别

建立两张表并为其添加一些数据

一张会员表,一张会员下单表。

会员表数据

iduseremail
1abeiabei@nai8.me
2whabei@maige123.com
3liuhuan267765@qq.com

订单表

iduser_idcreate_time...
111489579802...
221489579802...
311489579802...
431489579802...
521489579802...
611489579802...

我们将用这两张表做演示。

什么是exists

exists表示存在,它常常和子查询配合使用,例如下面的SQL语句 


 
 
  1. SELECT * FROM `user`
  2. WHERE exists ( SELECT * FROM `order` WHERE user.id = order.user_id)

exists用于检查子查询是否至少会返回一行数据,该子查询实际上并不返回任何数据,而是返回值TrueFalse

当子查询返回为真时,则外层查询语句将进行查询。
当子查询返回为假时,外层查询语句将不进行查询或者查询不出任何记录。

因此上面的SQL语句旨在搜索出所有下过单的会员。需要注意的是,当我们的子查询为 SELECT NULL 时,MYSQL仍然认为它是True

exists和in的区别和使用场景

是的,其实上面的例子,in这货也能完成,如下面SQL语句


 
 
  1. SELECT * FROM `user`
  2. WHERE id in ( SELECT user_id FROM `order`)

那么!in和exists到底有啥区别那,要什么时候用in,什么时候用exists那?接下来阿北一一教你。

我们先记住口诀再说细节!“外层查询表小于子查询表,则用exists,外层查询表大于子查询表,则用in,如果外层和子查询表差不多,则爱用哪个用哪个。”

In关键字原理


 
 
  1. SELECT * FROM `user`
  2. WHERE id in ( SELECT user_id FROM `order`)

in()语句只会执行一次,它查出order表中的所有user_id字段并且缓存起来,之后,检查user表的id是否和order表中的user_id相当,如果相等则加入结果期,直到遍历完user的所有记录。

in的查询过程类似于以下过程


 
 
  1. $result = [];
  2. $users = " SELECT * FROM `user` ";
  3. $orders = " SELECT user_id FROM `order` ";
  4. for($i = 0;$i < $users.length;$i++){
  5. for($j = 0;$j < $orders.length;$j++){
  6. // 此过程为内存操作,不涉及数据库查询。
  7. if($users[$i].id == $orders[$j].user_id){
  8. $result[] = $users[$i];
  9. break;
  10. }
  11. }
  12. }

我想你已经看出来了,当order表数据很大的时候不适合用in,因为它最多会将order表数据全部遍历一次。

如:user表有10000条记录,order表有1000000条记录,那么最多有可能遍历10000*1000000次,效率很差.

再如:user表有10000条记录,order表有100条记录,那么最多有可能遍历10000*100次,遍历次数大大减少,效率大大提升.

exists关键字原理


 
 
  1. SELECT * FROM `user`
  2. WHERE exists ( SELECT * FROM `order` WHERE user.id = order.user_id)

在这里,exists语句会执行user.length次,它并不会去缓存exists的结果集,因为这个结果集并不重要,你只需要返回真假即可。

exists的查询过程类似于以下过程


 
 
  1. $result = [];
  2. $users = " SELECT * FROM `user` ";
  3. for($i=0;$i<$users.length;$i++){
  4. if(exists($users[$i].id)){// 执行SELECT * FROM `order` WHERE user.id = order.user_id
  5. $result[] = $users[$i];
  6. }
  7. }

你看到了吧,当order表比user表大很多的时候,使用exists是再恰当不过了,它没有那么多遍历操作,只需要再执行一次查询就行。

如:user表有10000条记录,order表有1000000条记录,那么exists()会执行10000次去判断user表中的id是否与order表中的user_id相等.

如:user表有10000条记录,order表有100000000条记录,那么exists()还是执行10000次,因为它只执行user.length次,可见B表数据越多,越适合exists()发挥效果.

但是:user表有10000条记录,order表有100条记录,那么exists()还是执行10000次,还不如使用in()遍历10000*100次,因为in()是在内存里遍历,而exists()需要查询数据库,我们都知道查询数据库所消耗的性能更高,而内存比较很快.

因此我们只需要记住口诀:“外层查询表小于子查询表,则用exists,外层查询表大于子查询表,则用in,如果外层和子查询表差不多,则爱用哪个用哪个。”

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值