什么是p-value
人们经常认为p-value与probability是一个概念,这是不对的。但是他们之间确实有一定的联系。probability表示的是某个事件发生的概率,而p-value表示的该事件与等价事件以及更rarer事件发生的概率之和,以表示当前事件是否是一个罕见的事件(数值越小表示越罕见)。
在投硬币实验中,一个硬币连续扔5次,那么4H1T(Head/Tail)的概率为4H与1T的全排列的个数除以 2 5 2^5 25,即 5 2 5 = 0.15625 \frac{5}{2^5}=0.15625 255=0.15625,而此事件对应的p-value为三个部分的加和:
- 发生该事件的概率:0.15625
- 发生等价该事件的概率(1H4T):0.15625
- 发生更极端事件的概率(5H,5T): 1 32 ∗ 2 = 0.0625 \frac{1}{32}*2=0.0625 321∗2=0.0625
求和为0.375,即4H1T事件的p-value是0.375,说明在0.05显著水平下,该事件不是一个罕见的事件。
假设身高符合以下正态分布,图中白线表示某个人身高落在该区间事件,则事件的概率为0.04(大体估计),该事件的p-value同样分为三个部分:
- 该事件概率:0.04
- 没有等价等价事件(因为这个区间在中间)
- 更极端事件的概率分为左右两边的红色区域:分别为0.48
则该事件的p-value为1。说明该事件发生一点也不特殊。
以上。
参考:StatQuest: P Values, clearly explained