hive函数 -- stddev , stddev_pop , stddev_samp , var_pop , var_samp

标准差是方差的平方根

1.方差公式:

m为x1,x2…xn数列的期望值(平均数)

s^2 = [(x1-m)^2 + (x2-m)^2 + … (xn-m)^2]/n

s即为标准差

s^2为方差。

2.实例:

hive> select * from dim_row_num limit 10;
OK
0
1
2
3
4
5
6
7
8
9

hive> select stddev(row_num) from dim_row_num where row_num<10;

的结果: 2.8722813232690143

即:

m = 4.5

s^2 = [(4.5*4.5 +3.5*3.5+2.5*2.5+1.5*1.5+0.5*0.5+0.5*0.5+1.5*1.5+2.5*2.5+3.5*3.5+4.5*4.5)/10] – 方差

s = 2.8722813232690143 – 标准差

另外:

stddev_pop = stddev

stddev_samp :

s^2 = [(x1-m)^2 + (x2-m)^2 + … (xn-m)^2]/n-1

即:

m = 4.5

s^2 = [(4.5*4.5 +3.5*3.5+2.5*2.5+1.5*1.5+0.5*0.5+0.5*0.5+1.5*1.5+2.5*2.5+3.5*3.5+4.5*4.5)/9] – 方差

s = 3.0276503540974917 – 标准差

标准差:

stddev=2.8722813232690143

stddev_samp=3.0276503540974917

stddev_pop=2.8722813232690143

方差:

var_samp=stddev_samp^2=9.166666666666666

var_pop=stddev_pop^2=8.25

3.总结:

当我们需要真实的标准差 方差的时候 最好是使用: stddev stddev_pop var_pop

而只是需要得到少量数据 标准差 方差 的近似值 可以选用: stddev_samp var_samp

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值