SQL高级语句部分知识点笔记

_53_

已于 2022-06-25 17:00:50 修改

阅读量250

点赞数

文章标签： sql

于 2022-06-24 20:41:37 首次发布

本文链接：https://blog.csdn.net/qq_48220470/article/details/125451408

版权

高级语句和前一篇中基础语句的区别在于，高级语句使用的场景不太相同，需要对基础语句进行组合性使用

窗口函数

标准语法： over partition by 字段名 order by 字段名 asc | desc

（注意 partition by 和 order by 二者之间没有，进行隔开，切忌加上逗号）

语法讲解：over()中两个子句为可选项，partition by指定分区依据，order by 指定排序依据

窗口函数的作用：

理解起来好比，我首先在第一个网页中进行一些操作得到结果，然后再另开一个新的网页，对刚刚的数据进行处理得到一些结果，然后再将这个新开的网页中得到的结果匹配回第一个网页中。

更加生动的例子就是：在计算数学题时，在试卷的空白处写好了解题过程，然后在草稿纸中进行计算得到最终结果，最后再将结果写到试卷中

在这个过程中，草稿纸的作用就是窗口函数的作用

如何理解窗口函数的语法结构呢？为什么over()要放在函数后面？该如何理解？

答：以rank() over()为例，over后面的相当于是草稿，也即是窗口函数，在over()里面将数据进行分区和排序，就好比是在over()里面做草稿，然后再将草稿中的结果返回。返回的方式就是 rank()。理解起来就像，over()将草稿打好，然后根据草稿的推理，直接将答案写到试卷上，而这个答案的获取就是 rank()

检测到窗口函数以后，返回时是返回到having语句之后，order by和limit可以引用窗口函数的结果，而having之前的语句则不行

排序窗口函数：

rank() over()：跳跃式排序。比如现在有成绩 100 100 99 98，那么排名为 1，1，3，4

dense_rank() over() ：并列连续型排序。有成绩 100 100 99 98，那么排名为 1，1，2，3

row_number() over()：连续型排序。有成绩 100 100 99 98，那么排名为 1，2，3，4

当数值没有重复时，三个函数作用相同

例题：

查询2017年选区为‘$14000024’的所有候选人所在团体和其选票数(votes)、还有候选人得票数在选区内对应的排名，结果按照团队party排序

select party, votes,
rank()over(order by votes desc)
from ge
where area = '$14000024' and yr = 2017

偏移分析函数：

lag(字段名，偏移量 ( 默认值 ) ) over()

作用：将某个字段向后延迟多少行 lag这个英文单词本身的意思是：滞后; 落后于

所以说，这个函数就相当于是将某个字段在某行延迟多少个单位

而lead函数，就是向下偏移

lead(字段名，偏移量 ( 默认值) ) over()

例题：

已知有一个疫情的表格，有国家、日期、每日累计确诊病例、累计治愈、累计死亡。

现要求查询法国和德国1月每天新增确诊人数，最后显示国家名，标准日期(2020-01-27)，当天截止时间累计确诊人数，昨天截止时间累计确诊人数，每天新增确诊人数，按照截至时间排序。如何处理？

思路：

用今天的累计确诊减去昨天的累计确诊便能够得到今日新增确诊

那么如何用代码实现？

select country,date
confirmed 累计确诊,
lag(confirmed, 1) over(partition by country order by date asc) 昨日累计确诊,
confirmed - lag(confirmed, 1) over(partition by country, order by date asc) 新增确诊
from covid
where country in ('France','Germany') and month(date) = 1
order by date

例题：

查询意大利每周新增确诊数，最后显示国家名，标准日期，每周新增人数，按照截止时间排序

select country 国家名,
date_format(whn, '%Y-%m-%d') 标准日期,
confirmed - lag(confirmed.1)over(order by date) 每周新增人数
from covid
where country = 'Italy' and weekday(whn) = 0
order by whn

窗口函数注意事项：

1.窗口函数只能写在select子句中

2.窗口函数中的 partition by 子句可以指定数据的分区，作用上和group by基本一致，但是区别在于：partition by 并不会去重

3.窗口函数中没有 partition by 子句时，说明此时不对数据进行分区，所有的数据组成一个区

4.排序窗口函数中 order by 子句是必选项，窗口函数中 order by子句在分区内，一句指定字段和排序方法对数据进行排序

5.rank() dense_rank() row_number() 这三个排序窗口函数的异同之处。