大厂面试-百度二面-关联查询时为什么建议小表驱动大表?

题目描述

假如Mysql数据库有两张表,一张表A,里面有10W条数据,一张表B,里面有100W条数据,此时需要你用左连接关联这两个表查询。

问题

把哪个表放在左边比较好?为什么呢?比如讲下比如表A在左边会扫描多少行?表B在左边会扫描多少行?具体原理讲讲

答:小表放在左边比较好,小表放在左边扫描的行数会少。

动手实验&实践是检验真理的唯一标准

SQL语句


-- 创建表A
CREATE TABLE table_a (
    id INT PRIMARY KEY,
    name VARCHAR(255),
    age INT
);

-- 创建表B
CREATE TABLE table_b (
    id INT PRIMARY KEY,
    full_name VARCHAR(255),
    weight INT
);

-- 初始化10W条数据的存储过程
DELIMITER //
CREATE PROCEDURE init_10w_data()
BEGIN
    DECLARE i INT DEFAULT 1;
    WHILE i <= 100000 DO
        INSERT INTO table_a (id, name, age) VALUES (i, CONCAT('Value', i), i*2);
        SET i = i + 1;
    END WHILE;
END //
DELIMITER ;

-- 初始化100W条数据的存储过程
DELIMITER //
CREATE PROCEDURE init_100w_data()
BEGIN
    DECLARE i INT DEFAULT 1;
    WHILE i <= 1000000 DO
        INSERT INTO table_b (id, full_name, weight) VALUES (i, CONCAT('Value', i), i*2);
        SET i = i + 1;
    END WHILE;
END //
DELIMITER ;

由于创建100W条数据太慢,改成10W条和100条
图片: https://uploader.shimo.im/f/lgdGKiNh0is5S7O3.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJleHAiOjE3MTA3NzM4MDYsImZpbGVHVUlEIjoiTDlrQkJyblBSTUMyNHdrSyIsImlhdCI6MTcxMDc3MzUwNiwiaXNzIjoidXBsb2FkZXJfYWNjZXNzX3Jlc291cmNlIiwidXNlcklkIjo2NjQwNTIxNH0.GkcoHh1Kn39X-5_DyjDCXKmYuWSrlIj0vr2ErjvgCmo

大表驱动小表

SELECT * FROM table_a LEFT JOIN table_b ON table_a.id = table_b.id;

查询结果10W,查询时间0.260s。(id=主键时)

图片: https://uploader.shimo.im/f/7EvADmMRbVNiR77l.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJleHAiOjE3MTA3NzM4MDYsImZpbGVHVUlEIjoiTDlrQkJyblBSTUMyNHdrSyIsImlhdCI6MTcxMDc3MzUwNiwiaXNzIjoidXBsb2FkZXJfYWNjZXNzX3Jlc291cmNlIiwidXNlcklkIjo2NjQwNTIxNH0.GkcoHh1Kn39X-5_DyjDCXKmYuWSrlIj0vr2ErjvgCmo

EXPLAIN(id=主键时)

  • 扫描:100031行*1行
  • 查询时间:0.260s

图片: https://uploader.shimo.im/f/WGzTgy1kpQ258csu.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJleHAiOjE3MTA3NzM4MDYsImZpbGVHVUlEIjoiTDlrQkJyblBSTUMyNHdrSyIsImlhdCI6MTcxMDc3MzUwNiwiaXNzIjoidXBsb2FkZXJfYWNjZXNzX3Jlc291cmNlIiwidXNlcklkIjo2NjQwNTIxNH0.GkcoHh1Kn39X-5_DyjDCXKmYuWSrlIj0vr2ErjvgCmo

EXPLAIN(id不等于主键时)

  • 扫描:100264行*100行
  • 查询时间:0.497s

小表驱动大表

SELECT * FROM table_b LEFT JOIN table_a ON table_a.id = table_b.id;

查询结果100,查询时间0.060s。(id=主键时)
在这里插入图片描述

EXPLAIN(id=主键时)

  • 扫描:100行*1行
  • 查询时间:0.060s

图片: https://uploader.shimo.im/f/TQym6c4CkdDN5SXv.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJleHAiOjE3MTA3NzM4MDYsImZpbGVHVUlEIjoiTDlrQkJyblBSTUMyNHdrSyIsImlhdCI6MTcxMDc3MzUwNiwiaXNzIjoidXBsb2FkZXJfYWNjZXNzX3Jlc291cmNlIiwidXNlcklkIjo2NjQwNTIxNH0.GkcoHh1Kn39X-5_DyjDCXKmYuWSrlIj0vr2ErjvgCmo

EXPLAIN(id不等于主键时)

  • 扫描:100行*100264行
  • 查询时间:0.459s

图片: https://uploader.shimo.im/f/HXYVvRciOeZdxV8j.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJleHAiOjE3MTA3NzM4MDYsImZpbGVHVUlEIjoiTDlrQkJyblBSTUMyNHdrSyIsImlhdCI6MTcxMDc3MzUwNiwiaXNzIjoidXBsb2FkZXJfYWNjZXNzX3Jlc291cmNlIiwidXNlcklkIjo2NjQwNTIxNH0.GkcoHh1Kn39X-5_DyjDCXKmYuWSrlIj0vr2ErjvgCmo

结论

  1. 如果不走索引,不管大表驱动小表还是小表驱动大表都一样,都是全扫描。
  2. 如果走索引,假如全部扫描大表m,全部扫描小表n,则大表驱动小表大概是mlgn,小表驱动大表大概是nlgm。lg可以大概理解成走索引的扫描次数(可能不准),所以左边的数量越小扫描次数越少,由此一般都建议小表驱动大表,可以有效地利用索引。
  3. 如果需要相等的数据的时候,小表驱动大表可以减少返回的数据,减少内存消耗,提高查询性能。

在这里插入图片描述

  • 31
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值