In关键字原理:
SELECT * FROM user
WHERE id in (SELECT user_id FROM product
)
in()语句只会执行一次,它查出product
表中的所有user_id字段并且缓存起来,之后,检查user
表的id是否和product
表中的user_id相当,如果相等则加入结果期,直到遍历完user
的所有记录。
原理:笛卡尔积,遍历外表次数*内表次数
in的查询过程类似于以下过程:
$result = [];
$users = "SELECT * FROM `user`";
$products = "SELECT user_id FROM `product`";
for($i = 0;$i < $users.length;$i++){
for($j = 0;$j < $products .length;$j++){
// 此过程为内存操作,不涉及数据库查询。
if($users[$i].id == $products[$j].user_id){
$result[] = $users[$i];
break;
}
}
}
exists关键字原理
SELECT * FROM user
WHERE exists (SELECT * FROM product
WHERE user.id = product.user_id)
exists语句会执行user.length次,它并不会去缓存exists的结果集,因为这个结果集并不重要,你只需要返回真假即可。
原理:外表次数*内表记录查询sql
exists的查询过程类似于以下过程:
$result = [];
$users = "SELECT * FROM `user`";
for($i=0;$i<$users.length;$i++){
if(exists($users[$i].id)){// 执行SELECT * FROM `product` WHERE user.id = product.user_id
$result[] = $users[$i];
}
}
当product表比user表大很多的时候,使用exists是再恰当不过了,它没有那么多遍历操作,只需要再执行一次查询就行。
但是:user表有10000条记录,product表有100条记录,那么exists()还是执行10000次,还不如使用in()遍历10000*100次,因为in()是在内存里遍历,而exists()需要查询数据库
,我们都知道查询数据库所消耗的性能更高,而内存比较很快.
结论:exist适合子表比父表数据大的情况,in则相反。使用时,需要正确评估父子表的数据预期增长情况做合适的选择。