今天突然被一同事问起SQL的标准执行顺序是怎样的,当时一时居然没有说出来。后来想想最基础的理论被忘干净了,惭愧。现在将其写下来以加深影响。
在SQL语言中,第一个被处理的子句是FROM子句.每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对客户端应用程序或者外部查询不可用。只是最后一步生成的表才会返回 给客户端。即SQL执行步骤
from
on
join
where
group
with
having
select
distinct
order
top
逻辑说明:
FROM:对FROM子句中的前两个表执行笛卡尔积(Cartesian product)(交叉联接),生成虚拟表Vtab1;
ON:对Vtab1应用ON筛选器。只有那些使<join_condition>为真的行才被插入Vtab2;
JOIN:如 果指定了OUTER JOIN(相对于CROSS JOIN 或(INNER JOIN),保留表(preserved table:左外部联接把左表标记为保留表,右外部联接把右表标记为保留表,完全外部联接把两个表都标记为保留表)中未找到匹配的行将作为外部行添加到 Vtab2,生成Vtab3.如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,直到处理完所有的表为止。
WHERE:对Vtab3应用WHERE筛选器。只有使<where_condition>为true的行才被插入Vtab4.
GROUP BY:按GROUP BY子句中的列列表对Vtab4中的行分组,生成Vtab5.
WITH CUBE|ROLLUP:把超组(Suppergroups)插入Vtab5,生成Vtab6.
HAVING:对Vtab6应用HAVING筛选器。只有使<having_condition>为true的组才会被插入Vtab7.
SELECT:处理SELECT列表,产生Vtab8.
DISTINCT:将重复的行从Vtab8中移除,产生Vtab9.
ORDER BY:将Vtab9中的行按ORDER BY 子句中的列列表排序,生成游标(Vtab10).即按ORDER BY子句中的列列表排序上步返回的行,返回游标VC10.这一步是第一步也是唯一一步可以使用SELECT列表中的列别名的步骤。这一步不同于其它步骤的 是,它不返回有效的表,而是返回一个游标,使用了ORDER BY子句的查询不能用作表表达式
TOP:从Vtab10的开始处选择指定数量或比例的行,生成表Vtab11,并返回调用者。