自己看书的一个读书笔记,把自己感觉有用记录一下,方便以后查阅,与大家分享一下。
《MS SQL Server2005 技术内幕—T-SQL查询》读书笔记一:SQL逻辑查询处理
如下代码清单:
(8) SELECT (9) DISTINCT (11) <TOP_specification> <select_list>
(1) FROM <left_table>
(3) <join_type> JOIN <right_table>
(2) ON <join_condition>
(4) WHERE <where_condition>
(5) GROUP BY <group_by_list>
(6) WITH {CUBE | ROLLUP}
(7) HAVING <having_condition>
(10) ORDER BY <order_by_list>
以上的一个SQL语句,就是按照上面的序号的顺序来执行,每个步骤会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只有最后一步生成的表才会返回给调用者。
步骤一,FROM:对FROM子句中的两个表执行笛卡尔积(交叉连接),生成虚拟表VT1。
步骤二, ON:对VT1应用ON筛选器。只有那些使<join_condition>为真的行才被插入VT2。
步骤三,OUTER(JOIN):如果指定的OUTER JOIN (相对于CROSS JOIN或 INNER JOIN),保留表(preservedt able)中未找到匹配的行将作为外部行添加到VT2,生成VT3。如果FROM子句中包含两个以上的表,则对上一个联接生成的结果表与下一个表重复执行步骤一到步骤三,直到所有的表为止。
步骤四,WHERE:对VT3应用WHERE筛选器。只有使<where_condition>为TRUE的行才会被插入VT4。
步骤五,GROUP BY :按GROUP BY子句中的列表对VT4中的行分组,生成VT5。
步骤六,CUBE|ROLLUP:把超组(Supergroups)插入VT5,生成VT6。
步骤七,对VT6应用HAVING 筛选器。只有使<having_condition>为TRUE的租才会被插入VT7。
步骤八,SELECT:处理SECLECT列表,产生VT8。
步骤九,DISTINCT:讲重复的行从VT8中移除,产生VT9。
步骤十,ORDER BY :将VT9中的行按ORDER BY子句中列列表排序,生成一个游标(VC10)。
步骤十一,从VC10的开始处选择指定数量或比例的行,生成表VT11,并返回给调用者。
以上步骤的注意点:
1. 如果步骤三中联接两个以上的表,将会对VT3和FROM子句中第三张表重复执行步骤一到步骤三。
2. 在步骤四中,因为数据还未被分组,这里还不能使用聚合筛选器。例如:不能使用
Where orderdate=Max(orderdate)。也不能引用SELECT 列表中别名,因为SELECT列表这时还未被处理。
3. 步骤三与步骤四中关于ON与Where筛选器的区别,只有在使用外部联接时,才会出现ON与Where这种逻辑差别。当使用内部联接时,在哪里制定逻辑表达式都无所谓,因为步骤三将被跳过。这些筛选器相继被应用,中间没有任何步骤。
二者之间的主要区别是,ON是在添加外部行(步骤三)之前被应用,而Where是在步骤三之后被应用。ON筛选器对保留中部分行的移除并不是最终的,因为步骤三回把这些行再添加进来,而Where筛选器对行的移除是最终的。
4. 步骤七中,Having是第一个也是唯一一个应用到已分组数据的筛选器。
5. 步骤八中,在Select列表中创建的别名不能在前面的步骤使用。实际上表达式别名甚至不能用于Select列表中其他表达式。你只能在Select列表后面的步骤中(如:Order By步骤)使用列的别名。
6. 步骤十中,这一步不同于其他步骤的是,该步骤返回的是一个游标。SQL是基于集合理论的。集合不会预先对它的行排序,它只是成员的逻辑集合,成员的顺序无关紧要。对表进行的查询可以返回一个对象,包含按特定物理顺序组织的行。ANSI把这种对象称为游标。 尽管SQL并不为表的行程序特定的顺序,但它却按特定的顺序维护列的位置。指定Select * 可以确保按照特定顺序返回。