sql执行顺序

SQL 不同于与其他编程语言的最明显特征是处理代码的顺序。在大数编程语言中,代码按编码顺序被处理,但是在SQL语言中,第一个被处理的子句是FROM子句,尽管SELECT语句第一个出现,但是几乎总是最后被处理。
      每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只是最后一步生成的表才会返回 给调用者。如果没有在查询中指定某一子句,将跳过相应的步骤。下面是对应用于SQL server 2000和SQL Server 2005的各个逻辑步骤的简单描述。

( 8 ) SELECT  
( 9 ) DISTINCT   
( 11 ) < Top  Num >   < select  list >
( 1 ) FROM   [left_table]
( 3 ) < join_type >   JOIN   < right_table >
( 2 ) ON   < join_condition >
( 4 ) WHERE   < where_condition >
过滤完 on where 数据,剩下的都是对字段进行处理,字段先格式化,然后才到group 进行聚合sum max avg 等计算
( 5 ) GROUP   BY   < group_by_list >
( 6 ) WITH   < CUBE  |  RollUP >
( 7 ) HAVING   < having_condition >
补充 union 顺序在这个位置
( 10 ) ORDER   BY   < order_by_list >

几乎每一步都生产 VT(虚拟表) , 那必须占用内存。
补充: 123 是找到表, 4 where 通过索引查找到对应的数据 5678910过滤排序对应的数据,放到内存中。然后返回给 连接数据库的句柄。

默认值:
int(11) NOT NULL DEFAULT '0',
`MARGIN_FREE` double NOT NULL DEFAULT '0',
varchar NOT NULL DEFAULT '',
`createtime` timestamp NULL default CURRENT_TIMESTAMP



逻辑查询处理阶段简介
  1. FROM:对FROM子句中的前两个表执行笛卡尔积(Cartesian product)(交叉联接),生成虚拟表VT1(想要VT1表小,就要在这里进行where过滤)
  2. ON:对VT1应用ON筛选器。只有那些使<join_condition>为真的行才被插入VT2。
  3. OUTER(JOIN):如 果指定了OUTER JOIN(相对于CROSS JOIN 或(INNER JOIN),保留表(preserved table:左外部联接把左表标记为保留表,右外部联接把右表标记为保留表,完全外部联接把两个表都标记为保留表)中未找到匹配的行将作为外部行添加到 VT2,生成VT3.如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,直到处理完所有的表为止。
  4. WHERE:对VT3应用WHERE筛选器。只有使<where_condition>为true的行才被插入VT4.
  5. GROUP BY:按GROUP BY子句中的列列表对VT4中的行分组,生成VT5.
  6. CUBE|ROLLUP:把超组(Suppergroups)插入VT5,生成VT6.
  7. HAVING:对VT6应用HAVING筛选器。只有使<having_condition>为true的组才会被插入VT7.
  8. SELECT:处理SELECT列表,产生VT8.
  9. DISTINCT:将重复的行从VT8中移除,产生VT9.
  10. ORDER BY:将VT9中的行按ORDER BY 子句中的列列表排序,生成游标(VC10).
  11. TOP:从VC10的开始处选择指定数量或比例的行,生成表VT11,并返回调用者。
注:步骤10,按ORDER BY子句中的列列表排序上步返回的行,返回游标VC10.这一步是第一步也是唯一一步可以使用SELECT列表中的列别名的步骤。这一步不同于其它步骤的 是,它不返回有效的表,而是返回一个游标。SQL是基于集合理论的。集合不会预先对它的行排序,它只是成员的逻辑集合,成员的顺序无关紧要。对表进行排序 的查询可以返回一个对象,包含按特定物理顺序组织的行。ANSI把这种对象称为游标。理解这一步是正确理解SQL的基础。
因为这一步不返回表(而是返回游标),使用了ORDER BY子句的查询不能用作表表达式。表表达式包括:视图、内联表值函数、子查询、派生表和共用表达式。它的结果必须返回给期望得到物理记录的客户端应用程序。例如,下面的派生表查询无效,并产生一个错误:
select *
from ( select orderid , customerid from orders order by orderid )
as d
下面的视图也会产生错误
create view my_view
as
select *
from orders
order by orderid
      在SQL中,表表达式中不允许使用带有ORDER BY子句的查询,而在T—SQL中却有一个例外(应用TOP选项)。
      所以要记住,不要为表中的行假设任何特定的顺序。换句话说,除非你确定要有序行,否则不要指定ORDER BY 子句。排序是需要成本的,SQL Server需要执行有序索引扫描或使用排序运行符。
如果形成笛卡尔积那无论如何都会很消耗性能,最后的过滤只是为了减少数据量的传输。

==============
下面更详细
==============
SQL语句中join连表时on和where后都可以跟条件,那么对查询结果集,执行顺序,效率是如何呢?
通过查询资料发现:
区别:
on是对中间结果进行筛选,where是对最终结果筛选。
执行顺序:
先进行on的过滤, 而后才进行join。
效率:
如果是inner join, 放on和放where产生的结果一样, 但没说哪个效率速度更高? 如果有outer join (left or right), 就有区别了, 因为on生效在先, 已经提前过滤了一部分数据, 而where生效在后.
最后来了解下T-SQL对查询逻辑处理。
T-SQL逻辑查询的各个阶段:
(5)SELECT DISTINCT TOP(<top_specification>) <select_list>                      
(1)FROM <left_table> <join_type> JOIN <right_table> ON <on_predicate> 
(2)WHERE <where_predicate>
(3)GROUP BY <group_by_specification>
(4)HAVING <having_predicate>
(6)ORDER BY <order_by_list>
T-SQL在查询各个阶级分别干了什么:
(1)FROM 阶段
    FROM阶段标识出查询的来源表,并处理表运算符。在涉及到联接运算的查询中(各种join),主要有以下几个步骤:
  a.求笛卡尔积。不论是什么类型的联接运算,首先都是执行交叉连接(cross join),求笛卡儿积,生成虚拟表VT1-J1。
      b.ON筛选器。这个阶段对上个步骤生成的VT1-J1进行筛选,根据ON子句中出现的谓词进行筛选,让谓词取值为true的行通过了考验,插入到VT1-J2。
      c.添加外部行。如果指定了outer join,还需要将VT1-J2中没有找到匹配的行,作为外部行添加到VT1-J2中,生成VT1-J3。
    经过以上步骤,FROM阶段就完成了。概括地讲,FROM阶段就是进行预处理的,根据提供的运算符对语句中提到的各个表进行处理(除了join,还有apply,pivot,unpivot)
(2)WHERE阶段
     WHERE阶段是根据<where_predicate>中条件对VT1中的行进行筛选,让条件成立的行才会插入到VT2中。
(3)GROUP BY阶段
      GROUP阶段按照指定的列名列表,将VT2中的行进行分组,生成VT3。最后每个分组只有一行。
(4)HAVING阶段
      该阶段根据HAVING子句中出现的谓词对VT3的分组进行筛选,并将符合条件的组插入到VT4中。
(5)SELECT阶段
  这个阶段是投影的过程,处理SELECT子句提到的元素,产生VT5。这个步骤一般按下列顺序进行
        a.计算SELECT列表中的表达式,生成VT5-1。
        b.若有DISTINCT,则删除VT5-1中的重复行,生成VT5-2
        c.若有TOP,则根据ORDER BY子句定义的逻辑顺序,从VT5-2中选择签名指定数量或者百分比的行,生成VT5-3
(6)ORDER BY阶段
     根据ORDER BY子句中指定的列明列表,对VT5-3中的行,进行排序,生成游标VC6. 

One example for the inner join and where condition 
select coulumns from table_01 inner join table_02 on 01.col1=02.col2 where 01 = 'A' and 02='B' with ur ;
from the db2 plan it will Optimized Statement like below  which remove the join on condition and using where replace it :

select coulumns from table_01 , table_02  where 01 = 'A' and 02='B'  and 01.col1=02.col2 with ur ;

上面优化后的sql 未必是最佳的 ,有可能程序index 会用不到的 。



先执行 on (生产大体积的数据耗内存)
在执行where
 多种sql实现,包括oracle和ms sql server都证明了其执行次序是先on后where,即一个带外连接的语句:
select * from a1 a left join a2 b on a.aa=b.cc where b.cc='3'中,是先执行外连接,再用where 条件筛选。然而毕竟大量数据的连接会耗时较长,在语义允许的情况下,如果想先对某表筛选,再连接,应该如何操作?
可写成如下形式:
select * from a1 a left join (select * from a2 where a2.cc='3') b on a.aa=b.cc;
当然,先where还是先on的结果往往是不同的。这里只是指出如何强制使筛选先发生的方法罢了。

谢谢。参考转载:
http://www.cnblogs.com/qanholas/archive/2010/10/24/1859924.html
http://blog.csdn.net/haohaixingyun/article/details/51646830
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值