postgresql学习笔记之中位数

中位数:对于一组有限个数的数据来说,它们的中位数是这样的一种数:这群数据里的一半的数据比它大,而另外一半数据比它小。 计算有限个数的数据的中位数的方法是:把所有的同类数据按照大小的顺序排列。如果数据的个数是奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据的算术平均值就是这群数据的中位数。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
众数:是在一组数据中,出现次数最多的数据,是一组数据中的原数据,而不是相应的次数。
1)平均数是通过计算得到的,因此它会因每一个数据的变化而变化。
2)中位数是通过排序得到的,它不受最大、最小两个极端数值的影响。部分数据的变动对中位数没有影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。
3)众数也是数据的一种代表数,反映了一组数据的集中程度.日常生活中诸如“最佳”、“最受欢迎”、“最满意”等,都与众数有关系,它反映了一种最普遍的倾向。
优缺点:
平均数:需要全组所有数据来计算;易受数据中极端数值的影响。中位数:仅需把数据按顺序排列后即可确定;不易受数据中极端数值的影响。众数:通过计数得到;不易受数据中极端数值的影响。
计算中位数:计算家庭收入的中位数

SELECT percentile_disc(0.5) WITHIN GROUP (ORDER BY income) FROM households;

percentile_disc()和percentile_cont()的区别
它们都可以用来查询各部门中薪水分布处于50%位置的人的薪水
而percentile_disc()得出的是数据中本来就有的原始数据中处于50%位置的人的薪水(这个值一定是原始数据中有的)可以用来计算中位数
percentile_cont()的出的是整体的数据情况按照一定的计算过程得到的处于50%位置的人应该有的薪水(这个值不一定是原始数据中有的)

注:本文仅供自己学习,如有侵权,请私信
参考文章:
https://blog.csdn.net/fw0124/article/details/7842039?(分析函数概念)
https://blog.csdn.net/fw0124/article/details/7843225?(分析函数之排序分布)
https://blog.csdn.net/fw0124/article/details/7845115?(分析函数之数值分布)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值