在说四分位数之前,我们先看下什么是中位数。中位数计算分为2步:
你可能听这个计算过程有点头疼,没关系,下面图片我举个具体的例子来看下如何计算出中位数
第2步,计算中间位置。数据总数4是偶数,中间位置的数就是第2个和第3个位置对应的数值,分别是11万,12万。
那么,中位数就是11万+12万的平均值,为11.5万元。
当马云进入酒吧后,中位数是多少呢?5个人的中间位置是第3个数对应的收入是12万,那么中位数是12万。
你看,即使马云这样的超级富豪进入数据集里,中位数还是能正确的描述出这批数据的整体收入水平,不会像平均值那样因为异常的数值产生变化。
中位数还有一些有用的“亲戚”,我们通过下面的图片来看一下。
正如我们之前讨论过的,中位数将一组数据从中间“咔嚓一刀”分为两部分,这组数据其实还可以继续分为4部分,我们称之为“四分位数”。
什么是四分位数呢?
第1步,求中位数
整个数据集按从小到大排序,最小的数值位于最左边,叫做下界。最右边的数值位于最右边,叫做上界。通过下界和上界我们可以知道数据集的最小值和最大值。
中位数将整个数据集从中间位置一分为二。中位数左边的数据都小于中位数,占整个数据集的50%。中位数右边的数据都大于中位数,占整个数据集的的50%。
直接肉眼看四分位数的5个数值是看不出什么东西