sql select 的执行顺序

最新推荐文章于 2024-01-22 14:34:04 发布

bit_x

最新推荐文章于 2024-01-22 14:34:04 发布

阅读量1k

点赞数

分类专栏：数据库文章标签： sql oracle join table list 数据库

数据库专栏收录该内容

17 篇文章 0 订阅

订阅专栏

SELECT语句的执行的逻辑查询处理步骤：

(8)SELECT (9)DISTINCT
(11)<TOP_specification> <select_list>
(1)FROM <left_table>
(3)　<join_type> JOIN <right_table>
(2)　 ON <join_condition>
(4)WHERE <where_condition>
(5)GROUP BY <group_by_list>
(6)WITH {CUBE | ROLLUP}
(7)HAVING <having_condition>
(10)ORDER BY <order_by_list>

每个步骤产生一个虚拟表，该虚拟表被用作下一个步骤的输入。只有最后一步生成的表返回给调用者。如

果没有某一子句，则跳过相应的步骤。

1. FROM:对FROM子句中的前两个表执行笛卡尔积，生成虚拟表VT1。

2. ON:对VT1应用ON筛选器。只有那些使<join_condition>为真的行才被插入VT2。

3. OUTER(JOIN):如果指定了OUTER JOIN，保留表中未找到匹配的行将作为外部行添加到VT2，生成VT3。

如果FROM子句包含两个以上的表，则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3，直到

处理完所有的表为止。

4. 对VT3应用WHERE筛选器。只有使<where_condition>为TRUE的行才被插入VT4。

5. GROUP BY:按GROUP BY 子句中的列列表对VT4中的行分组，生成VT5。

6. CUBE|ROLLUP:把超组插入VT5，生成VT6。

7. HAVING:对VT6应用HAVING筛选器。只有使<having_condition>为TRUE的组才会被插入VT7。

8. SELECT:处理SELECT列表，产生VT8。

9. DISTINCT:将重复的行从VT8中移除，产生VT9。

10. ORDER BY:将VT9中的行按ORDER BY子句中的列列表排序，生成一个有表(VC10)。

11. TOP:从VC10的开始处选择指定数量或比例的行，生成表VT11,并返回给调用者。

一、sql语句的执行步骤：
1）语法分析，分析语句的语法是否符合规范，衡量语句中各表达式的意义。
2）语义分析，检查语句中涉及的所有数据库对象是否存在，且用户有相应的权限。
3）视图转换，将涉及视图的查询语句转换为相应的对基表查询语句。
4）表达式转换，将复杂的 SQL 表达式转换为较简单的等效连接表达式。
5）选择优化器，不同的优化器一般产生不同的“执行计划”
6）选择连接方式， ORACLE 有三种连接方式，对多表连接 ORACLE 可选择适当的连接方式。
7）选择连接顺序，对多表连接 ORACLE 选择哪一对表先连接，选择这两表中哪个表做为源数据表。
8）选择数据的搜索路径，根据以上条件选择合适的数据搜索路径，如是选用全表搜索还是利用索引或是其他的方式。
9）运行“执行计划”
二、oracle 共享原理：
ORACLE将执行过的SQL语句存放在内存的共享池(shared buffer pool)中，可以被所有的数据库用户共享当你执行一个SQL语句(有时被称为一个游标)时,如果它和之前的执行过的语句完全相同, ORACLE就能很快获得已经被解析的语句以及最好的执行路径. 这个功能大大地提高了SQL的执行性能并节省了内存的使用
三、oracle 语句提高查询效率的方法：1： where column in(select * from ... where ...); 2：... where exists (select 'X' from ...where ...); 第二种格式要远比第一种格式的效率高。在Oracle中可以几乎将所有的IN操作符子查询改写为使用EXISTS的子查询使用EXIST，Oracle系统会首先检查主查询，然后运行子查询直到它找到第一个匹配项，这就节省了时间 Oracle系统在执行IN子查询时，首先执行子查询，并将获得的结果列表存放在在一个加了索引的临时表中避免使用having字句避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作. 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销

SQL Select语句完整的执行顺序：

1、from子句组装来自不同数据源的数据；
2、where子句基于指定的条件对记录行进行筛选；
3、group by子句将数据划分为多个分组；
4、使用聚集函数进行计算；
5、使用having子句筛选分组；
6、计算所有的表达式；
7、使用order by对结果集进行排序。

为什么表的别名可以出现在select 查询列表中
为什么列的别名可以出现在order by 字句中
为什么列的别名不能出现在group by 字句中
为什么from 字句中设置了表的别名之后在select 查询列表中就不能使用原表名
……

理解了select 语句的执行顺序，这些问题就变得有趣而不是烦恼

完整的select查询语句结构：

select colun,group_function   -- 5
from table         --1
[where condition ]       ---2
[group by group_by_expression ]    --3
[having group_condition ]      --4
[order by column]     -- 6

执行顺序：

1 拿到表
2 对表数据进行过滤
3 符合条件的通过group by 进行分组
4 分组数据通过having 字句进行组函数过滤
5 从得到的结果集中选取需要显示的字段
6 按照指定的字段进行排序，作为最终结果呈现给用户

明白了select 语句的执行顺序，下面的规律也变得有趣……

1 select 字句：
可以使用子查询

2 where 子句：
不允许对select 中的字段使用分组函数
可以使用子查询

3 group by 子句：
紧接在where 字句的后边
如果添加group by 字句，必须保证出现在select 字句中字段，如果出现的位置不在组函数中，必须出现在group by 字句中
出现在group by 字句中出现的字段，可以不出现在select 字句中

4 having 字句：
可以使用组函数
可以使用子查询

5 order by 字句：
可以使用表的列别名
可以使用组函数
可以含有算术表达式的

一个示例：
拿到每个部门的员工的个数

select d.deptno x ,count(e.empno) num --5 -- 拿到部门号和员工数
from emp e full join dept2 d --1
on e.deptno=d.deptno
where e.empno<>7499 --2
group by d.deptno --3
having d.deptno in (10,20,30,40) --4
order by x --6