MySQL性能优化（六）-- in和exists

最新推荐文章于 2023-06-09 22:45:01 发布

壹醉方休

最新推荐文章于 2023-06-09 22:45:01 发布

阅读量177

点赞数

本文链接：https://blog.csdn.net/u010821757/article/details/103351225

版权

in和exists哪个性能更优

sql脚本：

/*建库*/

create database testdb6;

use testdb6;

/* 用户表 */

drop table if exists users;

create table users(

    id int primary key auto_increment,

    name varchar(20)

);

insert into users(name) values ('A');

insert into users(name) values ('B');

insert into users(name) values ('C');

insert into users(name) values ('D');

insert into users(name) values ('E');

insert into users(name) values ('F');

insert into users(name) values ('G');

insert into users(name) values ('H');

insert into users(name) values ('I');

insert into users(name) values ('J');

/* 订单表 */

drop table if exists orders;

create table orders(

    id int primary key auto_increment,/*订单id*/

    order_no varchar(20) not null,/*订单编号*/

    title varchar(20) not null,/*订单标题*/

    goods_num int not null,/*订单数量*/

    money decimal(7,4) not null,/*订单金额*/

    user_id int not null    /*订单所属用户id*/

)engine=myisam default charset=utf8 ;

delimiter $$

drop procedure batch_orders $$

/* 存储过程 */

create procedure batch_orders(in max int)

begin

declare start int default 0;

declare i int default 0;

set autocommit = 0;  

while i < max do

   set i = i + 1;

   insert into orders(order_no,title,goods_num,money,user_id) 

   values (concat('NCS-',floor(1 + rand()*1000000000000 )),concat('订单title-',i),i%50,(100.0000+(i%50)),i%10);

 　 end while;

commit;

end $$

delimiter ;

/*插入1000万条订单数据*/

call batch_orders(10000000);     /*插入数据的过程根据机器的性能 花费的时间不同，有的可能3分钟，有的可能10分钟*/

上面的sql中订单表中（orders）存在userid，而又有用户表（users），所以我们用orders表中userid和user表中的id 来in 和 exists。

结果

1.where后面是小表

（1）select count(1) from orders o where o.userid in(select u.id from users u);（2）select count(1) from orders o where exists (select 1 from users u where u.id = o.userid);

2.where后面是大表（1）select count(1) from users u where u.id in (select o.userid from orders o);（2）select count(1) from users u where exists (select 1 from orders o where o.userid = u.id);分析我们用下面的这两条语句分析：

select count(1) from orders o where o.user_id in(select u.id from users u);

select count(1) from orders o where exists (select 1 from users u where u.id = o.user_id);

1.in：先查询in后面的users表，然后再去orders中过滤，也就是先执行子查询，结果出来后，再遍历主查询，遍历主查询是根据user_id和id相等查询的。

即查询users表相当于外层循环，主查询就是外层循环

小结：in先执行子查询，也就是 in()所包含的语句。子查询查询出数据以后，将前面的查询分为n次普通查询(n表示在子查询中返回的数据行数)

2.exists：主查询是内层循环，先查询出orders，查询orders就是外层循环，然后会判断是不是存在order_id和 users表中的id相等，相等才保留数据，查询users表就是内层循环

这里所说的外层循环和内层循环就是我们所说的嵌套循环，而嵌套循环应该遵循“外小内大”的原则，这就好比你复制很多个小文件和复制几个大文件的区别

小结：如果子查询查到数据，就返回布尔值true；如果没有，就返回布尔值false。返回布尔值true则将该条数据保存下来，否则就舍弃掉。也就是说exists查询，是查询出一条数据就执行一次子查询

结论

小表驱动大表。

in适合于外表大而内表小的情况，exists适合于外表小而内表大的情况。