Hive 分析函数 RANK ROW_NUMBER CUME_DIST CUME_DIST

@SmartSi

已于 2024-08-13 07:08:05 修改

阅读量1.9k

点赞数 2

分类专栏： Hive 文章标签： Hive 分析函数 RANK ROW_NUMBER NTILE

于 2017-02-22 16:34:58 首次发布

本文链接：https://blog.csdn.net/sunnyyoona/article/details/56488568

版权

Hive 专栏收录该内容

51 篇文章 2 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了Hive中的几个关键分析函数，包括RANK()、DENSE_RANK()、PERCENT_RANK()、ROW_NUMBER()、CUME_DIST()和NTILE()。这些函数在数据处理中用于排名和分组，帮助用户对数据进行排序和分析。例如，RANK()在有相同值时会留下排名空位，而DENSE_RANK()则不会有空位。PERCENT_RANK()提供百分比排名，ROW_NUMBER()给出分区中行的序号，CUME_DIST()计算相对排名，NTILE()将行均匀划分为指定数量的组。

摘要由CSDN通过智能技术生成

1. 常用分析函数

下表列出了一些分析函数以及描述信息：

分析函数	描述
RANK	返回数据项在分区中的排名。排名值序列可能会有间隔
DENSE_RANK	返回数据项在分区中的排名。排名值序列是连续的，不会有间隔
PERCENT_RANK	计算当前行的百分比排名
ROW_NUMBER	确定分区中当前行的序号
CUME_DIST	计算分区中当前行的相对排名
NTILE()