SQL-窗口函数进阶用法:ntile(),percent_rank(),cume_dist()

窗口函数基础用法回顾

SQL-窗口函数知识点及案例学习_格勒王的博客-CSDN博客窗口函数的初步介绍,学习如何使用窗口函数计算排序、推移和累加求和等操作https://blog.csdn.net/weixin_47198715/article/details/130829177下面介绍几种虽然不太常用,但是关键时刻可以发挥重要作用的窗口函数

1、分组:ntile(n)

现在有一个班级60名同学的数学测验分数,现在按照分数把同学分为10组,SQL如下

(帮助记忆:tile的英文单词是瓦片的意思,很形象吧)

select
student_id,
score,
ntile(10)over(order by score) as level
from table_name

2、排名占比:percent_rank()

现在有一份班级60名同学各科分数数据,现在计算每科排名前20%的同学

percent_rank计算的是(rank分组计数-1)/(总计数-1),从0-1分布

select
student_id,
subject,
score
from 
    (select
    student_id,
    score,
    subject,
    RANK() OVER ( PARTITION BY subject ORDER BY score DESC) AS rank ,
    PERCENT_RANK() OVER ( PARTITION BY subject ORDER BY socre DESC) AS percent_rank
from table_name)
where percent_rank<=0.2

3、累计占比:

还是上述数据,现在想要计算得到每科,每个分数下,有多少同学的得分超过了该分数,也就是说在大于等于当前得分的同学数量累计占比

select
student_id,
subject,
score,
accumulate
from 
    (select
    student_id,
    score,
    subject,
    RANK() OVER ( PARTITION BY subject ORDER BY score DESC) AS rank ,
    cume_dist() OVER ( PARTITION BY subject ORDER BY socre DESC) AS accumulate
from table_name)

对比理解percent_rank()和cume_dist()

得分排名percent_rank
结果
percent_rank
计算公式
percent_rank
含义
12010.0(1-1)/(6-1)该学生得分最高(含并列)
12010.0(1-1)/(6-1)该学生得分最高(含并列)
12010.0(1-1)/(6-1)该学生得分最高(含并列)
11940.6(4-1)/(6-1)该学生的排名在前60%
11850.8(5-1)/(6-1)该学生的排名在前80%
11061.0(6-1)/(6-1)该学生排名最末
得分排名cume_dist
结果
cume_dist
计算公式
cume_dist
含义
12010.53/6有50%的学生得分达到了120分以上
12010.53/6
12010.53/6
11940.6666666674/6
11850.8333333335/6
110616/6

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是这些分析函数在SQL中的语法和实例: 1. DENSE_RANK函数语法:DENSE_RANK() OVER (ORDER BY column_name) DENSE_RANK函数可以用来计算某一列的密集排名,即相等值的数据行将得到相同的排名,但是排名之间没有间隔。 示例: 假设我们有一个名为“customers”的表,其中包含客户名称和订单总数。我们可以使用DENSE_RANK函数来按订单总数对客户进行排名,如下所示: SELECT customer_name, order_total, DENSE_RANK() OVER (ORDER BY order_total DESC) as dense_rank FROM customers; 结果将返回客户名称、订单总数和密集排名,按订单总数降序排序。 2. NTILE函数语法:NTILE(n) OVER (ORDER BY column_name) NTILE函数可以将一列数据分成n个等份,并返回每个数据所在的组号。 示例: 假设我们有一个名为“students”的表,其中包含学生姓名和成绩。我们可以使用NTILE函数将学生按成绩分成3组,并返回每个学生所在的组号,如下所示: SELECT student_name, grade, NTILE(3) OVER (ORDER BY grade DESC) as ntile FROM students; 结果将返回学生姓名、成绩和组号,按成绩降序排序并分成3组。 3. RANK函数语法:RANK() OVER (ORDER BY column_name) RANK函数可以用来计算某一列的排名,相等值的数据行将得到相同的排名,并且排名之间会有间隔。 示例: 假设我们有一个名为“employees”的表,其中包含员工姓名和销售额。我们可以使用RANK函数来按销售额对员工进行排名,如下所示: SELECT employee_name, sales, RANK() OVER (ORDER BY sales DESC) as rank FROM employees; 结果将返回员工姓名、销售额和排名,按销售额降序排序。 4. ROW_NUMBER函数语法:ROW_NUMBER() OVER (ORDER BY column_name) ROW_NUMBER函数可以用来给每一行数据分配一个唯一的数字标识,不考虑数据是否相等。 示例: 假设我们有一个名为“orders”的表,其中包含订单号、客户名称和订单总数。我们可以使用ROW_NUMBER函数来对订单进行编号,并按订单总数降序排序,如下所示: SELECT order_number, customer_name, order_total, ROW_NUMBER() OVER (ORDER BY order_total DESC) as row_number FROM orders; 结果将返回订单号、客户名称、订单总数和行号,按订单总数降序排序并为每个订单分配一个唯一的行号。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值