IN:
确定给定的值是否与子查询或列表中的值相匹配。
使用IN时,子查询先产生结果集,然后主查询再去结果集中寻找符合要求的字段列表,
符合要求的输出,反之则不输出。
EXISTS:
给定一个子查询,检测行的存在。它不返回列表的值,只返回一个True或False。
其运行方式是先运行主查询一次,再去子查询中查找与其对应的结果,如果子查询返回True则输出,
反之则不输出。再根据主查询中的每一行去子查询中查询。
1、select * from A where id in (select id from B);
in()只执行一次,它查出B表中的所有id字段并缓存起来。之后,检查A表的id是否与B表中的id相等,如果相等则将A表的记录加入结果集中,直到遍历完A表的所有记录。
2、select * from A where exists (select 1 from B where A.id=B.id);
exists()会执行A.length次,它并不缓存exists()结果集,因为exists()结果集的内容并不重要,重要的是其内查询语句的结果集空或者非空,空则返回false,非空则返回true。
当B表比A表数据大时适合使用exists(),因为它没有那么多遍历操作,只需要再执行一次查询就行。
如:A表有10000条记录,B表有1000000条记录,那么exists()会执行10000次查询去判断A表中的id是否与B表中的id相等,IN会在内存中遍历10000*1000000次。
如:A表有10000条记录,B表有100000000条记录,那么exists()还是执行10000次,因为它只执行A.length次,可见B表数据越多,越适合exists()发挥效果。
再如:A表有10000条记录,B表有100条记录,那么exists()还是执行10000次,IN执行10000*100次.
还不如使用in()遍历10000*100次,因为in()是在内存里遍历比较,而exists()需要查询数据库,我们都知道查询数据库所消耗的性能更高,而内存比较很快。
所以当B表数量较小时,使用IN()