如何通俗地理解分位数?
分位数在平时的一个应用场景;
什么是分位数?以概率将一批数据进行分割
如何计算?
一天,老班气冲冲地走进教室对我们说:“太不像话了,这次考试竟然有60%的同学不及格!” 老师这句话里就有一个分位数的应用。
什么是分位数?
在此我不想给出书上的定义,因为有那么多的同学发问怎么求分位数,正是因为不理解书上所写,好,怎么才能快速理解分位数呢?
一句话,分位数就是用概率作为依据将一批数据分开的那个点。
一、你首先得有数据
分位数是数据分析中常用的一个统计量,经过抽样得到一个样本值,以学生成成绩为例:
60,70,87,56,35,64,28,84,89,65.
二、p分位数
如果想在这10位同学中淘汰至少35%,同时让至少65%的同学晋级,你怎么选?
当然的想法是找一个数,小于等于这个数的同学至少有35%,大于等于这个数的同学至少有65%, 我们就把这个数记为0.35分位点,记为x_0.35 ,见下图:
要想顺利地找到这个数,需要将数据排序:
28, 35, 56, 60,64, 65, 70, 84, 87, 89
排序后上面十个数分别记为x(1)到x(10).
至少有35%,即至少有10*35%=3.5个学生,所以x_0.35 ≥60=x(4);
至少有65%,即至少有10*65%=6.5个学生,所以x_0.35≤60=x(4);
故二者取交集,令x_0.35 =60.
以上是np不为整数的情况,如果np为整数,不妨设p=0.3
至少有30%,即至少有10*30%=3个学生,所以x_0.3 ≥56=x(3);
至少有70%,即至少有10*70%=7个学生,所以x_0.3≤60=x(4);
二者取交集,有两个值,一个是56,一个是60,如何选取?就取二者的平均值:
x_0.3=(56+60)/2=58.
三、小结
通过以上讨论,我们可以得到如下结论:
所谓样本的p分位数x_p具有两个性质:一是有np个观察值小于等于x_p;二是有n(1-p)个观察值大于等于x_p, x_p的求法如下: