最近在整理 Hie 分析函数资料的时候,看到了 CUME_DIST,百度后还是不知其意。于是乎用起了之前介绍的 Webcrawler 搜索引擎 :http://www.webcrawler.com/
发现 SQL Server中也包含该分析函数。接下来让我们看看如何在 SQL Server 2012 中使用该分析函数,以帮助大家深入理解 CUME_DIST 函数在 Hive 中的使用。
根据 SQL Server 给出的解释,它提供该函数主要用来计算分布值,当然肯定跟具体的业务逻辑相挂钩的。这里也不是一两句话能解释清楚的,大家可以将该函数跟我们学习概率统计的时候“小球取出不放回”的场景结合理解会更好。
接下来,让我们看看该函数的具体应用:
CUME_DIST() 函数的计算方式为:小于等于当前值的行数 / 当前分组总行数
USE AdventureWorks
GO
SELECT SalesOrderID, OrderQty,
CUME_DIST() OVER(ORDER BY SalesOrderID) AS CDist
FROM