postgresql学习笔记之中位数

最新推荐文章于 2024-05-30 07:32:10 发布

大妮哟

最新推荐文章于 2024-05-30 07:32:10 发布

阅读量1.6k

点赞数

文章标签： postgresql 数据库

本文链接：https://blog.csdn.net/weixin_44847119/article/details/120195284

版权

中位数：对于一组有限个数的数据来说，它们的中位数是这样的一种数：这群数据里的一半的数据比它大，而另外一半数据比它小。计算有限个数的数据的中位数的方法是：把所有的同类数据按照大小的顺序排列。如果数据的个数是奇数，则中间那个数据就是这群数据的中位数；如果数据的个数是偶数，则中间那2个数据的算术平均值就是这群数据的中位数。对于有限的数集，可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个，通常取最中间的两个数值的平均数作为中位数。
众数：是在一组数据中,出现次数最多的数据，是一组数据中的原数据，而不是相应的次数。
1）平均数是通过计算得到的，因此它会因每一个数据的变化而变化。
2）中位数是通过排序得到的，它不受最大、最小两个极端数值的影响。部分数据的变动对中位数没有影响，当一组数据中的个别数据变动较大时，常用它来描述这组数据的集中趋势。
3）众数也是数据的一种代表数，反映了一组数据的集中程度．日常生活中诸如“最佳”、“最受欢迎”、“最满意”等，都与众数有关系，它反映了一种最普遍的倾向。
优缺点：
平均数：需要全组所有数据来计算；易受数据中极端数值的影响。中位数：仅需把数据按顺序排列后即可确定；不易受数据中极端数值的影响。众数：通过计数得到；不易受数据中极端数值的影响。
计算中位数：计算家庭收入的中位数

SELECT percentile_disc(0.5) WITHIN GROUP (ORDER BY income) FROM households;

percentile_disc()和percentile_cont()的区别
它们都可以用来查询各部门中薪水分布处于50%位置的人的薪水
而percentile_disc()得出的是数据中本来就有的原始数据中处于50%位置的人的薪水（这个值一定是原始数据中有的）可以用来计算中位数
percentile_cont()的出的是整体的数据情况按照一定的计算过程得到的处于50%位置的人应该有的薪水（这个值不一定是原始数据中有的）

注：本文仅供自己学习，如有侵权，请私信
参考文章：
https://blog.csdn.net/fw0124/article/details/7842039?（分析函数概念）
https://blog.csdn.net/fw0124/article/details/7843225?（分析函数之排序分布）
https://blog.csdn.net/fw0124/article/details/7845115?（分析函数之数值分布）

大妮哟

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
postgresql学习笔记之中位数

中位数：对于一组有限个数的数据来说，它们的中位数是这样的一种数：这群数据里的一半的数据比它大，而另外一半数据比它小。计算有限个数的数据的中位数的方法是：把所有的同类数据按照大小的顺序排列。如果数据的个数是奇数，则中间那个数据就是这群数据的中位数；如果数据的个数是偶数，则中间那2个数据的算术平均值就是这群数据的中位数。对于有限的数集，可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个，通常取最中间的两个数值的平均数作为中位数。众数：是在一组数据中,出现次数最多的数据，是一组数据中
复制链接

扫一扫