表的初始化
CREATE TABLE `t2` (
`id` INT(11) NOT NULL,
`a` INT(11) DEFAULT NULL,
`b` INT(11) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `a` (`a`)
) ENGINE=InnoDB;
DROP PROCEDURE IF EXISTS idata;
DELIMITER ;;
CREATE PROCEDURE idata()
BEGIN
DECLARE i INT;
SET i=1;
WHILE (i <= 1000) DO
INSERT INTO t2 VALUES (i,i,i);
SET i=i+1;
END WHILE;
END;;
DELIMITER ;
CALL idata();
CREATE TABLE t1 LIKE t2;
INSERT INTO t1 (SELECT * FROM t2 WHERE id<=100);
Index Nested-Loop Join
-- 使用JOIN,优化器可能会选择t1或t2作为驱动表
-- 使用STRAIGHT_JOIN,使用固定的连接关系,t1为驱动表,t2为被驱动表
SELECT * FROM t1 STRAIGHT_JOIN t2 ON (t1.a=t2.a);
mysql> EXPLAIN SELECT * FROM t1 STRAIGHT_JOIN t2 ON (t1.a=t2.a);
+----+-------------+-------+------------+------+---------------+------+---------+-----------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+-----------+------+----------+-------------+
| 1 | SIMPLE | t1 | NULL | ALL | a | NULL | NULL | NULL | 100 | 100.00 | Using where |
| 1 | SIMPLE | t2 | NULL | ref | a | a | 5 | test.t1.a | 1 | 100.00 | NULL |
+----+-------------+-------+------------+------+---------------+------+---------+-----------+------+----------+-------------+
执行过程
- 从t1读取一行数据R
- 从R中取出字段a,然后到t2去查找
- 取出t2中满足条件的行,与R组成一行,作为结果集的一部分
- 重复上面步骤,直至遍历t1完毕
扫描行数
- 对驱动表t1做全表扫描,需要扫描100行
- 对每一行R,根据字段a去t2查找,走的是树搜索过程。构造的数据都是一一对应,总共扫描100行
- 因此,整个执行流程,总扫描行数为200行
# Time: 2019-03-10T11:06:13.271095Z
# User@Host: root[root] @ localhost [] Id: 8
# Query_time: 0.001391 Lock_time: 0.000135 Rows_sent: 100 Rows_examined: 200
SET timestamp=1552215973;
SELECT * FROM t1 STRAIGHT_JOIN t2 ON (t1.a=t2.a);
不使用Join
- 执行SELECT * FROM t1,扫描100行
- 循环遍历100行数据
- 从每一行R中取出字段a的值$R.a
- 执行SELECT * FROM t2 WHERE a=$R.a
- 把返回的结果和R构成结果集的一行
- 对比Join
- 同样扫描了200行,但总共执行了101条语句,客户端还需要自己拼接SQL语句和结果
选择驱动表
- 上面的查询语句,驱动表走全部扫描,被驱动表走树搜索
- 假设被驱动表的行数为M
- 每次在被驱动表上查一行数据,需要先搜索辅助索引a,再搜索主键索引
因此,在被驱动表上查一行的时间复杂度是 2∗log2M
- 每次在被驱动表上查一行数据,需要先搜索辅助索引a,再搜索主键索引
- 假设驱动表的行数为N,需要扫描驱动表N行
- 整个执行过程,时间复杂度为 N+N∗2∗log2M
- N对扫描行数的影响更大,因此选择小表做驱动表
Simple Nested-Loop Join
SELECT * FROM t1 STRAIGHT_JOIN t2 ON (t1.a=t2.b);
被驱动表t2的字段b上没有索引,因此每次到t2去做匹配的时候,都要做一次全表扫描
按照上面的算法,时间复杂度为 N+N∗M,总扫描行数为100,100次(10W)
- 假如t1和t2都是10W行数据,那么总扫描次数为10,000,100,000次(100亿)
- 因此,MySQL本身没有使用Simple Nested-Loop Join算法
Block Nested-Loop Join
针对场景:被驱动表上没有可用的索引
join_buffer充足
执行过程
- 把t1的数据读入线程内存join_buffer,执行的是SELECT *,因此会把整个t1读入join_buffer
- 扫描t2,把t2中的每一行取出来,与join_buffer中的数据做对比
- 如果满足join条件的行,作为结果集的一部分返回
-- 默认为256KB
-- 4194304 Bytes == 4 MB
mysql> SHOW VARIABLES LIKE '%join_buffer_size%';
+------------------+---------+
| Variable_name | Value |
+------------------+---------+
| join_buffer_size | 4194304 |
+------------------+---------+
EXPLAIN
mysql> EXPLAIN SELECT * FROM t1 STRAIGHT_JOIN t2 ON (t1.a=t2.b);
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+
| 1 | SIMPLE | t1 | NULL | ALL | a | NULL | NULL | NULL | 100 | 100.00 | NULL |
| 1 | SIMPLE | t2 | NULL | ALL | NULL | NULL | NULL | NULL | 1000 | 10.00 | Using where; Using join buffer (Block Nested Loop) |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+
# Time: 2019-03-10T12:19:57.245356Z
# User@Host: root[root] @ localhost [] Id: 8
# Query_time: 0.010132 Lock_time: 0.000192 Rows_sent: 100 Rows_examined: 1100
SET timestamp=1552220397;
SELECT * FROM t1 STRAIGHT_JOIN t2 ON (t1.a=t2.b);
- 整个过程中,对t1和t2都做了一次全表扫描,总扫描行数为1100
- 由于join_buffer是以无序数组的方式组织的,因此对t2的每一行数据,都需要做100次判断。因此,在内存中的总判断次数为100,000次
- Simple Nested-Loop Join的扫描行数也是100,000次,时间复杂度是一样的
- 但Block Nested-Loop Join的100,000次判断是内存操作,速度会快很多
- Simple Nested-Loop Join可能会涉及磁盘操作(全表扫描)
选择驱动表
- 假设小表的行数为N,大表的行数为M
- 两个表都要做一次全表扫描,总扫描行数为M+N
- 内存中的判断次数是M*N
- 此时,选择大表还是小表作为驱动表,没有任何差异
join_buffer不足
-- 放不下t1的所有数据,采取分段放的策略
SET join_buffer_size=1200;
# Time: 2019-03-10T12:30:32.194726Z
# User@Host: root[root] @ localhost [] Id: 8
# Query_time: 0.009459 Lock_time: 0.000559 Rows_sent: 100 Rows_examined: 2100
SET timestamp=1552221032;
SELECT * FROM t1 STRAIGHT_JOIN t2 ON (t1.a=t2.b);
执行过程
- 扫描t1,顺序读取数据行放入join_buffer,放完第88行后join_buffer满,继续第2步
- 扫描t2,把t2中的每一行取出来,跟join_buffer中的数据做对比
- 如果满足join条件的行,作为结果集的一部分返回
- 清空join_buffer(为了复用,体现Block的核心思想)
- 继续扫描t1,顺序取最后12行数据加入join_buffer,继续执行第2步
性能
- 由于t1被分成了两次加入join_buffer,导致t2会被扫描两次,因此总扫描行数为2100
- 但是内存的判断次数还是不变的,依然是100,000次
选择驱动表
-
假设驱动表的数据行数为N,需要分K段才能完成算法流程,被驱动表的数据行数为M
K并非常数,N越大K越大,定义:K=N∗λ,λ∈(0,1]
在join_buffer_size固定且t1和2表类似的情况下,λ是常量
扫描行数为 N+λ∗N∗M- 减少N比减少M,扫描的行数会更小
- 因此选择小表当驱动表
内存判断次数为 N∗M(无需考虑)
如果要减少λ的值,可以加大join_buffer_size的值,一次性放入的行越多,分段就越少
对比Simple Nested-Loop Join
- Simple Nested-Loop Join需要对被驱动表做全表扫描
- 对被驱动表做全表扫描的时候,如果数据没有在Buffer Pool中,就需要等待这部分数据从磁盘读入
- 从磁盘读入数据到内存,会影响正常业务的Buffer Pool命中率
- Simple Nested-Loop Join算法天然会对被驱动表的数据做多次访问
- 因此,更容易将这些数据页放到Buffer Pool的头部
- 从磁盘读入数据到内存,会影响正常业务的Buffer Pool命中率
- 即使被驱动表的数据都在内存中,BNL算法的遍历成本更低
- Simple Nested-Loop Join遍历的是Buffer Pool,采用链表的形式
- BNL遍历的是join_buffer,采用数组的形式
- 因此BNL算法的性能会更好
小表
-- 恢复为默认值256KB
SET join_buffer_size=262144;
过滤行数
t1为驱动表
**mysql> EXPLAIN SELECT * FROM t1 STRAIGHT_JOIN t2 ON (t1.b=t2.b) WHERE t2.id