已经开始数据分析工作的同学,大都知道从数据库中取数、查数是常见的工作内容,而理解查询的顺序之后,能够帮助我们更好排查出现的错误,还能优化SQL的执行速度。对于要面试数据分析的同学,能够回答出查询顺序的问题,是能够大大加分的,且有时还是必问的。
先看个小问题
大家先在自己的电脑上运行下类似这句代码
select
country
, sum(area)
from
country_data
where
sum(area) > 1000
group by
country
运行成功了吗?先想下30秒,然后接着看哟(提示:SQL执行顺序)
SQL执行顺序
我们通过看一个完整的查询来看下执行顺序。
--Complete SELECT query
SELECT DISTINCT column, AGG_FUNC(column_or_expression), …
FROM mytable
JOIN another_table
ON mytable.column = another_table.column
WHERE constraint_expression
GROUP BY column
HAVING constraint_expression
ORDER BY column ASC/DESC
LIMIT count OFFSET COUNT;
1.From and JOIN
首先我们进行查询的时候,肯定是先获得一份数据集的,From语句和JOIN被先执行的,就是为了获得数据集的。
<