MySQL 中 SELECT 的执行顺序
- 查询的结构
# SQL92 语法
SELECT ..., ..., ... (存在聚合函数)
FROM ..., ..., ...
WHERE 多表的连接条件 AND / OR 不包含聚合函数的过滤条件
GROUP BY ..., ...
HAVING 包含聚合函数的过滤条件
ORDER BY ..., ... (ASC / DESC)
LIMIT ..., ...
# SQL99 语法
SELECT ..., ..., ... (存在聚合函数)
FROM ... (LEFT / RIGHT) JOIN ... ON 多表的连接条件
(LEFT / RIGHT) JOIN ... ON 多表的连接条件
WHERE 多表的连接条件 AND / OR 不包含聚合函数的过滤条件
GROUP BY ..., ...
HAVING 包含聚合函数的过滤条件
ORDER BY ..., ... (ASC / DESC)
LIMIT ..., ...
/*
其中:
(1)from:从哪些表中筛选
(2)on:关联多表查询时,去除笛卡尔积
(3)where:从表中筛选的条件
(4)group by:分组依据
(5)having:在统计结果中再次筛选
(6)order by:排序
(7)limit:分页
*/
- SELECT 语句的执行顺序(MySQL和Oracle几乎相同)
# SQL92
FROM --> WHERE --> GROUP BY --> HAVING -->
SELECT --> DISTINCT --> ORDER BY --> LIMIT
# SQL99
FROM <left_table> -->
ON <join_condition> -->
<join_type> JOIN <right_table> -->
WHERE <where_condition> -->
GROUP BY <group_condition> -->
HAVING <having_condition> -->
SELECT -->
DISTINCT <select_list> -->
ORDER BY <order_by_condition> -->
LIMIT <limit_number>
- 举个例子
SELECT DISTINCT player_id, player_name, count(*) as num # 顺序 5
FROM player JOIN team ON player.team_id = team.team_id # 顺序 1
WHERE height > 1.80 # 顺序 2
GROUP BY player.team_id # 顺序 3
HAVING num > 2 # 顺序 4
ORDER BY num DESC # 顺序 6
LIMIT 2; # 顺序 7
在 SELECT 语句执行这些步骤的时候,每个步骤都会产生一个 虚拟表
,然后将这个虚拟表传入下一个步骤中作为输入。需要注意的是,这些步骤隐含在 SQL 的执行过程中,对于我们来说是不可见的。
SQL 执行原理
SELECT 是先执行 FROM 这一步的。在这个阶段,如果是多张表联查,还会经历下面的几个步骤:
-
首先,先通过 CROSS JOIN 求笛卡尔积,相当于得到虚拟表
vt(virtual table)1-1
; -
通过 ON 进行筛选,在虚拟表 vt1-1 的基础上进行筛选,得到虚拟表
vt1-2
; -
添加外部行。如果我们使用的是左连接、右链接或者全连接,就会涉及到外部行,也就是在虚拟表 vt1-2 的基础上增加外部行,得到虚拟表
vt1-3
。
当然如果我们操作的是两张以上的表,还会重复上面的步骤,直到所有表都被处理完为止。这个过程得到是我们的原始数据。
当我们拿到了查询数据表的原始数据,也就是最终的虚拟表 vt1
,就可以在此基础上再进行WHERE阶段
。在这个阶段中,会根据 vt1
表的结果进行筛选过滤,得到虚拟表 vt2
。
然后进入第三步和第四步,也就是 GROUP 和 HAVING 阶段
。在这个阶段中,实际上是在虚拟表 vt2
的 基础上进行分组和分组过滤,得到中间的虚拟表 vt3
和 vt4
。
当我们完成了条件筛选部分之后,就可以筛选表中提取的字段,也就是进入到 SELECT 和 DISTINCT 阶段
。
首先在 SELECT 阶段会提取想要的字段,然后在 DISTINCT 阶段过滤掉重复的行,分别得到中间的虚拟表 vt5-1
和 vt5-2
。
当我们提取了想要的字段数据之后,就可以按照指定的字段进行排序,也就是 ORDER BY 阶段
,得到 虚拟表 vt6
。
最后在 vt6
的基础上,取出指定行的记录,也就是 LIMIT 阶段
,得到最终的结果,对应的是虚拟表 vt7
。
当然我们在写 SELECT 语句的时候,不一定存在所有的关键字,相应的阶段就会省略。
同时因为 SQL 是一门类似英语的结构化查询语言,所以我们在写 SELECT 语句的时候,还要注意相应的 关键字顺序, 所谓底层运行的原理,就是我们刚才讲到的执行顺序。