hive 常用到的数学统计函数

avg(col)--指定行的值的平均值;

avg(distinct col)--排重后的值的平均值;

min(col)--指定行的值的最小值;

max(col)--指定行的值的最大值;

variance(col)--返回col 中一组数值的方差;

var_pop(col)---返回col 中一组数值的方差;

var_samp(col)--返回col 中一组数值的样本方差;

stddev_pop(col)--返回col 中一组数值的标准偏差;

stddev_samp(col)--返回col 中一组数值的样本偏差;

covar_pop(col1,col2)--返回一组数值的协方差;

covar_samp(col1,col2)--返回一组数值的样本协方差;

corr(col1,col2)--返回两组数值的相关系数;

percentile(bigint int_expr,p)--int_expr在p(范围是[0,1])处对应的百分比,其中p是double型;

percentile(bigint int_expr,array(p1[,p2…]))--int_expr在p(范围是[0,1])处对应的百分比,其中p是double型数组;

percentile(double col,p[,NB])--col在p(范围是[0,1])处对应的百分比,其中p是double型,NB是用于估计的直方图中的仓库数量(默认10000);

percentile_approx(double col,array(p1[,p2…])[,NB])--col在p(范围是[0,1])处对应的百分比,其中p是double型数组,NB是用于估计的直方图中的仓库数量(默认10000);

对于数据统计,保证数据都是数值类型的。

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值