percentile_approx 聚合函数

菜鸟Octopus

已于 2023-10-08 20:24:27 修改

阅读量994

点赞数

分类专栏： Spark On Hive调优文章标签： hive spark

于 2023-08-15 15:10:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zy345293721/article/details/132299430

版权

Spark On Hive调优专栏收录该内容

13 篇文章 4 订阅

订阅专栏

文章最前：我是Octopus，这个名字来源于我的中文名--章鱼；我热爱编程、热爱算法、热爱开源。所有源码在我的个人github ；这博客是记录我学习的点点滴滴，如果您对 Python、Java、AI、算法有兴趣，可以关注我的动态，一起学习，共同进步。

相关文章：

返回组内 expr 的百分位近似值。此函数是 approx_percentile 聚合函数的同义词。

语法

percentile_approx ( [ALL | DISTINCT ] expr, percentile [, accuracy] ) [FILTER ( WHERE cond ) ]

还可以使用 OVER 子句将此函数作为窗口函数调用。

参数

expr：数值表达式。
percentile：介于 0 和 1 之间的数值，或每个数值都介于 0 和 1 之间的数值文本数组。
accuracy：大于 0 的整数文本。如果省略准确性，则将其设置为 10000。
cond：一个可选的布尔表达式，可筛选用于聚合的行。

返回

聚合函数返回在已排序的组（从最小到最大排序）中为最小值的表达式，因此最多 expr 值的 percentile 小于或等于该值。如果 percentile 是数组 percentile_approx，则以指定的百分位返回 expr 的近似百分位数组。

accuracy 参数以内存成本控制近似精度。准确度值越高，准确度越高，1.0/accuracy 是近似值的相对误差。

如果指定了 DISTINCT，则该函数只对一组唯一的 expr 值运行。

示例

> SELECT percentile_approx(col, array(0.5, 0.4, 0.1), 100)
FROM VALUES (0), (1), (2), (10) AS tab(col);
[1,1,0]

> SELECT percentile_approx(col, 0.5, 100)
FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
9

> SELECT percentile_approx(DISTINCT col, 0.5, 100)
FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
7

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
percentile_approx 聚合函数

返回组内expr的百分位近似值。此函数是的同义词。
复制链接

扫一扫

专栏目录

菜鸟Octopus CSDN认证博客专家 CSDN认证企业博客

码龄12年

人工智能领域新星创作者

294: 原创

6827: 周排名

3639: 总排名

54万+: 访问

: 等级

8422: 积分

2186: 粉丝

791: 获赞

122: 评论

961: 收藏

私信

关注

热门文章

分类专栏

pytorch 17篇
机器学习 11篇
LightGBM 7篇
pyspark专栏 10篇
pandas 9篇
mysql 7篇
tensorflow 7篇
Spark On Hive调优 13篇
Linux基础操作 4篇
分布式系统基础 8篇
java基础 47篇
Redis原理 6篇
LeetCode 128篇
python 9篇

最新评论

Java使用google-ortools库的方法
qxdzy: Resource win32-x86-64/ was not found in ClassLoader sun.misc.Launcher$AppClassLoader@18b4aac2 出现这个错误,说我的dll文件没有整对文件放在这个-Djava.library.path=D:\or-tools里了.这是出现什么错误了,还是下载的dll文件不对
com.mysql.jdbc.MysqlDataTruncation: Data truncation: Data too long for column ‘current_state‘
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数。
多线程的应用与原理分析8（countdownlatch）
CSDN-Ada助手: 如何在驱动程序开发中支持设备的热插拔功能？
多线程的应用与原理分析7（Condition）
CSDN-Ada助手: 如何在驱动程序开发中实现设备的省电功能？
Factory工厂类设计模式
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。