-- A表为小表 B表为大表
select * from A where cc in (select cc from B)
select * from A where exists(select cc from B where cc=A.cc)
-- ()内部cc可以换成 * 但却不会影响执行效率,因为exists只关心 此行存在与否,不关心字段值
首先 exists,会对外层表做全盘扫描
括号内为内层表,外部为外层表
在MySql 5.5及之前
in 执行时会被优化为 exists; (内层表会转为exsits语句执行,无法使用索引)
网上常见说法:
(关联字段建立索引情况下)
如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in:
解释:
in语句可以使用外层表的索引,而exist可以使用内层表的索引;大表做内层表时,exists使用大表的索引,而in只能使用小表的索引
自5.6版本,MySQL将in优化为join查询( join 即是 inner join ,内连接,它是一个笛卡尔积 ),优化器对 in 操作符可以自动完成优化,针对建立了索引的列可以使用索引,没有索引的列还是会走全表扫描。
外层大表内层小表,用in。exsits会对外表做全盘扫描,in被转化为join(inner join)查询,而join查询会自动选择小表做驱动表,则能对外层大表使用索引;而此时exsits只能使用小表索引
外层小表内层大表,in和exists效率差不多 ;两者都对大表使用索引
无论哪个版本,如果查询的两个表大小相当,那么用in和exists差别不大。