SQL的查询模型

逻辑查询处理的各个阶段
一个普通格式的查询
(5)SELECT DISTINCT TOP N <SELECTLIST>
(1)FROM <LEFTTB> JOIN <RIGHTTB> ON <ONPRE>
(2)WHERE <WHEREPRE>
(3)GROUP BY <SPECIFICATION>
(4)HAVING <HAVINGPRE>
(6)ORDER BY <ORDERBYLIST>
SQL与其他的编程语言不同,SQL第一个处理的子句是FROM子句,上面已标记出一个Select语句的执行顺序,ORDER BY是最后执行,SELECT是第五步执行。
具体看看Select的顺序执行:
(1)FROM:
标识出查询的来源表,处理表运算符,每一个表运算符也会有一系列子阶段:笛卡尔积、on筛选器、添加外部行。from最后会生成一张虚拟表。笛卡尔积是对两张表执行交叉联接。on筛选器是根据on子句中的谓词进行筛选,取值为true时保留。添加外部行是如果Join是outer join,则将保留表中被删除的行需要重新添加回去。
(2)WHERE:
根据where子句中出现的谓词对查询表进行筛选,谓词为true的记录会保留。
(3)GROUP BY:
对GROUP BY子句中的列名进行分组,每一个分组最后只有一行数据。
(4)HAVING:
根据HAVING子句的谓词对上一步返回的表进行筛选,为true的保留。
(5)SELECT:
SELECT子句中会有子阶段:SELECT列表表达式、DISTINCT 、TOP 。
(6)ORDER BY:
根据ORDER BY子句的列表进行排序,生成游标。


在搞清执行顺序之后,我们对每一步的内部执行进行探索:
步骤1;FROM阶段
from阶段负责标识表或要查询的表,如果指定了表运算符,这个阶段要按从左到右顺序对这些运算符进行处理。
这里主要是cross join交叉联接,inner join内联接,outer join外联接,其中外联接还被分成left outer join 、right outer join 、full outer join。
其中cross join是交叉联接,是笛卡尔积,返会一个n*m的表。
inner join是在cross join 返回结果的基础上根据on筛选器中的谓词进行筛选,为true保留。
outer join外联连是在内联接的返回结果基础上,将保留表中被删除的行添加回来,添加回来的数据叫做外部行,外部行中非保留表的属性被赋值为Null。
小讨论:三值逻辑
SQL中的重要特性,在SQL里面的谓词可能取值:true、false和unknown。unknown通常出现在涉及Null值的逻辑表达式中。true的取反是false,unknown取反还是unknown。
在查询筛选器中(on、WHERE、HAVING)把unknown看做false。
check约束中的unknown看做true。
在Unique约束、集合运算符(union),以及排序、分组,认为两个Null值是相等的。
步骤2:WHERE阶段
对上一步返回的虚拟表中的所有行应用where筛选器,逻辑为true的保留,因为在where阶段之前还没有进行分组操作,所以在where子句中不能使用聚合函数。对于包含outer join子句时,on筛选器和where筛选器的区别是on在添加外部行之前,where在这之后,on筛选器的结果不是最终的,有可能在添加外部行时被重新添加回来,where筛选器是最终的结果。
步骤3:GROUP BY阶段
在GROUP BY阶段,根据指定的列表将上一步返回的表进行分组。这里指定的列表称为分组集,分组是按照分组集中所有属性值的每一个唯一组合标识出一个组。表中的每一行数据都和一个组关联,且紧关联到一个组。最终为每一组生成一行数据,则后面所有的步骤(SELECT 、HAVING)只能指定在每一组上得到标量(单个)值的表达式。在这个阶段两个Null被认为是相等的。
步骤4:HAVING 阶段
having筛选器用于对上一步返回的表中的组进行筛选,逻辑为true保留,having是唯一可用于分组数据的筛选器。
步骤5:select阶段
select子句出现在查询语句的最前面,但是放在第五步处理,将构造最终返回给调用者的表,其中有三个子阶段:计算表达式 可以对列名取别名、distinct、Top选项。
步骤6:ORDER BY阶段
这一步按ORDER BY子句中的列名列表对上一步返回的表进行排序,返回游标。ORDER BY是唯一可以使用select列表中创建列别名的步骤。

ORDER BY与top同时使用情况:
在逻辑上,top选项是在ORDER BY排序阶段之前,作为select的一部分处理,它的目的是基于某种顺序的逻辑定义,筛选出请求的数量或者百分比的行。
可惜top没有自己排序子句,而是借助同一查询中的ORDER BY子句来提供逻辑排序,但是ORDER BY子句又是用于对查询结果的排序。这样一来就不能为top和查询结果分别定义排序逻辑,这就是top选项的限制。所以sql Server是这样实现两者关系的:当最外层查询中使用top,ORDER BY 有两种作用:为top定义行的逻辑优先顺序、为结果游标定义排序顺序。当top定义表表达式时,只有第一种作用,会返回一个表。

其他的一些小知识
表运算符:join等
集合运算符:union等
over子句与聚合函数一起使用:
select OrdreID,Count(*) over(partition by customerid) as num from orders

select customerid,ROW_NUMBER() over(partition by customerid ORDER BY OrdreID DESCas num from orders


over子句与row_number函数一起使用:
SELECT
    ROW_NUMBER() OVER (ORDER BY A.InDate ASC) AS RowNumber
    ,A.[SysNo]
    ,A.[Content]
    ,A.[Type]
    ,A.[InDate]
FROM INFO A WITH(NOLOCK)

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DataShow是一款基于.net Framework2.0的Microsoft SQL Server数据库建模工具,工具全部采用C#代码完成。该工具旨在利用自定义表字典的功能来设计强大的数据库控件或者页面,减少开发周期和代码量。 本工具具有如下特点: 1、支持自定义表的种类,将创建的表予以分类。 在创建种类时您可以为种类设置此种表的模板列,在创建该种类的表时,工具会提示您载入模板列,这种设计可以减少同类表多次创建时的工作量。 2、种类包含一个前缀,有利于数据库表的命名规范。 3、创建/编辑表定义时,您可以拷贝、粘贴多个列以减少创建表时的工作量。 4、每个列都包含编辑格式、列宽、显示格式等多种自定义属性,在设计控件时,您可以根据这些属性为不同的字段设计不同的编辑控件。 当然除了以上列举的属性外,还有部分未被设计进本工具的属性,如验证属性、查询属性等。关于这方面的应用请参考本工具的预览功能。 5、编辑格式及预览功能支持您自行扩展的用户控件以进行更高级的设计。 您可以创建一个项目,添加对DataShow.Interfaces.dll的引用,并实现其中的接口,将编译好的DLL添加到[选项]->[插件]的列表中即可在编辑格式或预览时看到您自定义的用户控件。 6、支持对数据库关系的维护。 在创建/编辑表定义时,您都可以打开关系设计界面对关系进行维护。 7、递归式的数据库修改。 当您更改某个受关系影响的列的数据类型、长度、精度、小数位数等信息时,关系中的其他字段将随之更改,这个过程是递归的,所有与该字段有直接或间接关系引用的字段都将受到更改。 8、为更改生成SQL脚本。 使用生成SQL脚本的功能,您可以像使用企业管理器一样为任意修改生成SQL脚本,通过工具内置的SQL执行工具,您可以将更改应用于多台开发机上以保持数据库的一致。 9、与自定义控件结合,使您在做表定义时即时预览到自定义控件的绑定效果。 10、内置有SQL执行工具,该工具是一款简单的查询分析器,目的旨在将您对数据库所做的更改快速布置到其他开发机上。 复杂的SQL语句建议您使用查询分析器完成。 11、表字典生成器让您快速地将本工具使用溶入开发中。 可能您的项目已经着手开发一段时间了,即使是这样,您依然可以让本工具为您效劳。您只需打开表字典生成工具,工具会读取数据库中所有的表及字段信息,根据您的配置生成字典。 12、数据库设计文档生成功能。 文档生成工具将根据您的表定义和字段定义读取字典表中的信息并将这些信息按照您定义的方式生成数据库设计文档。生成方式采用写流方式生成,生成速度快,免去您编写数据库文档的麻烦。 13、备份、还原、收缩数据库功能。 14、表数据预览及编辑功能。 您可以在选项中关闭修改显示的表数据的功能。 15、工具包括多项人性化选项。 16、表定义说明:表工具使用初期,工具会检查您数据库中的是否已经存在Dic_Columns、Dic_Datatypes、Dic_Relation、Dic_RelationDetail、Dic_Sequence、Dic_Tables、Dic_TableTemplate以及Dic_TableType,如果您的数据库中不存在这些表,工具会自行创建。 Dic_Columns:存储字段信息,各个字段的说明请查看表字义。 Dic_Datatypes:存储数据类型信息。 Dic_Relation:存储表关系,各个字段的说明请查看表字义。 Dic_RelationDetail:存储表关系的字段关联信息,各个字段的说明请查看表字义。 Dic_Sequence:用于生成序列号,一般是用于生成主键编号,请勿修改这个表的数据。 Dic_Tables:存储表的字典信息。 Dic_TableTemplate:存储种类的字段模板,各个字段的说明请查看表字义。 Dic_TableType:存储种类信息。 关于作者: 作者:陈鹏伟 联系方式:QQ 89202269 手机:13788892380。 此工具是本人利用业余时间编写数月的成果,转载请保留作者信息。 由于水平有限且没有专门的测试人员做测试= =!BUG在所难免,如果您有任何意见或建议,或者希望索取源码,欢迎与本人联系。 特别鸣谢:张希禄 我的启蒙老师,这个工具的设计来自他关于DataShow的思路。 希望本工具能为您的开发带来方便!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值