分析函数_CUME_DIST -- SQL Server 2012 & Hive

本文探讨了SQL Server 2012和Hive中的CUME_DIST分析函数,通过实例展示了其计算方式和应用场景。CUME_DIST函数用于计算分布值,与概率统计中的"小球取出不放回"场景类似。文章详细解释了函数如何在不同场景下工作,包括无分区和带分区的情况,并强调了分析函数在GROUP BY和ORDER BY操作之后执行的逻辑。
摘要由CSDN通过智能技术生成

最近在整理 Hie 分析函数资料的时候,看到了 CUME_DIST,百度后还是不知其意。于是乎用起了之前介绍的 Webcrawler 搜索引擎 :http://www.webcrawler.com/

发现 SQL Server中也包含该分析函数。接下来让我们看看如何在 SQL Server 2012 中使用该分析函数,以帮助大家深入理解 CUME_DIST 函数在 Hive 中的使用。

根据 SQL Server 给出的解释,它提供该函数主要用来计算分布值,当然肯定跟具体的业务逻辑相挂钩的。这里也不是一两句话能解释清楚的,大家可以将该函数跟我们学习概率统计的时候“小球取出不放回”的场景结合理解会更好。
接下来,让我们看看该函数的具体应用:

CUME_DIST() 函数的计算方式为:小于等于当前值的行数 / 当前分组总行数 

USE AdventureWorks
GO
SELECT SalesOrderID, OrderQty,
CUME_DIST() OVER(ORDER BY SalesOrderID) AS CDist
FROM

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值