一条SQL语句有几部分组成?执行一条SQL时各部分是按照什么顺序执行的?带着这些问题我们一起学习一下。首先看一下标准的SQL的组成,标准的SQL有下面10部分组成。知道SQL每部分执行的顺序对熟练编写SQL语句至关重要。
有两张表student,score
步骤一
执行from语句。from后跟的表,如果1张表,该表的全部数据作为该步骤的临时表V1;
如果from后有2张表,则取两张表的笛卡尔积作为该步骤的临时表V1(12条记录);
步骤二
执行on语句。在上一步的临时表V1的基础上根据on后面的条件过滤掉不符合的数据行得到临时表V2
步骤三
执行join语句。这里是指根据join的类型,在上一步临时表V2的基础上把相应的数据行补充进去得到临时表V3,如果为left join,则把左表中不在临时表V2中的数据补充进去。可以看到比V3多了1行。
如果为right join,则把右表中不在临时表V2中的数据补充进去。可以看到比V2没有变化,是因为右表中的已经都包含在V2中。
如果为inner join,因为V2已经符合on条件了,V3比V2也不会有变化。
步骤四
执行where语句。在V3基础上过滤不符合where条件的数据行得到临时表V4。
步骤五
执行group by语句。一般group by分组就是为了做统计,这里用count统计函数来展示效果。该步骤执行的结果是group by分组后的临时表V5(例子只是为了看效果,单纯的分组效果不好展示)。
步骤六
执行having语句生成临时表V6。having语句与where语句的区别是,where语句中无法使用统计函数,having可以使用统计函数。为展示having的效果,我们把score表中数据删掉1条。
user_id=2的学生只有一门考试成绩,所以不符合having条件,最终结果只有1条数据。
步骤七
执行select语句,按照select后面的列名选出需要的列,生成临时表V7(在临时表V6的基础上选择2个列)。
步骤八
执行distinct语句得到临时表V8。这里SQL与步骤五相差一个distinct关键字,结果可以看到按照学生姓名去重后再计数。
步骤九
执行order by语句得到临时表V9。这里order by语句使用select语句里的别名,说明order by语句是在select选择输出字段后执行的。
步骤十
执行top语句得到临时表V10。也就是说top语句是在order by语句后执行的,这一点比较好理解,因为只有排序后的数据取前几条才有意义。本文是以mysql为例,但mysql不支持top,可以用limit替代。
在实际执行过程中,由于各种数据库优化器都会对SQl进行一些优化,比如谓词下推(PPD)等,所以实际执行的顺序可能和以上描述的标准顺序不完全一致,但这并不妨碍本篇主题的论述。