从中位数的不足说开去

本文探讨了统计学中平均数与中位数的使用场景及局限性,通过对比分析,阐述了两者在反映数据集中趋势时的不同优势与不足。文章指出,尽管中位数能在一定程度上避免极端值的影响,但它无法揭示数据的总体结构,也不能替代平均数在某些统计分析中的作用。
摘要由CSDN通过智能技术生成

转载来源

    近日,看到一本书稿,主要内容是统计学和政府统计工作的基础知识。其中有一个问题,讲的是平均数和中位数。而讲中位数时,在介绍了其基本概念、作用之后,该书还指出了其两点不足。一是不能推算总体。因为其只是一系列个体数字由大到小排序后,位居中间的那个数字的数值,上面和下面的数字可能有各种各样的情况;二是不能分出结构。除非是把一个大的总体,再划分成若干小的总体,并在每个总体所有数字中寻找居中的那一个。但对一个或大或小的总体而言,中位数只有这么一个,没有更多的结构数据。

    坦率说,笔者虽然学过统计,且边干边学地几乎干了一辈子统计,但因为不是统计专业的科班出身,基础知识很不牢固。虽然这些年也说过、写过中位数,但还真的没有细想过这一指标的优缺点。曾几何时,我们都是用各种各样的平均数来说明问题,如平均工资、人均收入、人均GDP等等。而随着统计数据越来越受到各界的关注,对平均数的质疑之声也越来越高,“被平均”、“拖后腿”的说法也不胫而走,成为人们调侃统计数据的常用语。在质疑、调侃声中,一些貌似有专业味道的声音也日渐强烈,“为什么不用中位数?”我曾向以一位顶尖高校的教授解释过,因为工资统计表由各个单位填报,没有每个职工个人的数据;要不,您给我们指点指点。但这位教授既不说出具体办法,却依然对我们冷嘲热讽。

    终于有一天,我们的城乡居民可支配收入中位数横空出世了。记得笔者当时就曾在多家纸媒发文,除肯定此举的积极意义外也指出,即使使用中位数,高于和低于这个数字的也依然各占一半,也依然会有人感到与自己的实际情况不符。不过,此后几年,中位数的发布由年度延伸到季度,且既有全体居民的,也有分城镇居民和农村居民的,并与人均收入的分组数据同时发布,使各界可以对城乡居民的收入水平有全面和多角度的了解认识,社会各界的质疑之声也明显减弱了。近日看到这部书稿中关于中位数不足的介绍,我顿时想,当年社会上有人说“为什么不用中位数取代平均数”,但即使我们有中位数,也取代不了平均数啊!

    而由中位数的不足,或可以给我们以下启示:

    其一,一个统计指标能说明一定的问题,但也只能说明一定的问题。一个指标不可能说明和解决所有的问题。我们使用这个指标,就必须严格按照这个指标的口径范围把握,特别是一些国际通行的统计指标。而对一些非国际通行的指标,也要保持口径范围的一致性、连续性和可比性。

    其二,在条件允许的情况下,为了从不同的角度观察和分析问题,我们的统计指标应尽可能地多一些。所谓条件允许,就是不增加基层负担,且能够保证数据质量。在此前提下,我们可以也应该尽可能汇总生成更多一些的综合性指标。如中位数的发布,显然就属于这种情况。我们的居民收入调查进行了许多年,可以计算并发布中位数。但我们很长时间没有做这件事。后来做了,显然比不做要好得多。

    其三,在做好以上两点的基础上,我们的宣传、科普工作可以更加深入和到位。从当年社会强烈呼唤中位数、甚至呼吁以中位数替代平均数,到后来我们正式发布中位数,似乎鲜有声音像今天这样把两者的意义、作用、乃至利弊讲清楚。而从今往后,再有类似的情况,我们真的应该也可以把该说的话说到说透。您呼唤以中位数替代平均数,我们不仅把两者都提供给您,还要告诉您它们的作用和不足,以便于您更好地认识统计工作和使用统计数据。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值