P值:
在原假设成立的情况下,得到样本观察结果或更极端的观察结果出现的概率,从而P值为否定H0的最低显著性水平
分为2部分理解:
- 在原假设成立的情况下,得到样本观察结果或更极端的观察结果出现的概率
- 为否定
的最低显著性水平
先对1解释,看下面例题:
以该题为例,第一个理解的核心是注重的是观察结果。
这里观察结果是
=4.3,我们要知道的是它在原假设成立条件下是不是合理的。重点理解以下几个问题:
- 得出来的图形是什么条件下的??谁的图形??
- P值和显著水平α关系
1.得出来的图形是什么条件下的??谁的图形??
X服从正态分布,
服从t分布:
不论是什么检验方法,实际上我们画的都是
成立条件下的
分布,已知样本情况只是其中一种
先考虑非标准和右侧检验情况:
如果真是从μ=4的情况下取出的样本,那么
越接近μ0越好,考虑样本观察结果或更极端的观察结果出现的概率(蓝色阴影面积),它在
成立条件下出现的概率即为p值。
几个典型问题:
Q1:
A:
抛硬币例子:假设抛了多组,每组100次,得到平均正面次数90次,而假设
是出现正面次数均值50次。极端情况是你已经看到的样本数据:在硬币均匀的条件下得到正面竟然平均出现90次!非常有理由怀疑H0假设这个条件(硬币均匀)不成立。
p值(蓝色面积)越小代表你的样本观察结果在H0成立条件下出现可能越小。
Q2:
A:
不是
出现的可能大小,
这时候是已知条件。
2.显著性水平α是人为给定的:
①作为接受和拒绝原假设的界限(非严谨说法)
②表示
成立时错误地拒绝它的概率(弃真错误),当
条件下已知的样本发生概率小于我们设定的显著性水平,就表示这个事件发生概率小到我们设定的就算它是真的也可以错误的拒绝的程度。
例题中标准化后的图(α和p值都是面积,概率):
α=0.05时,p值>显著水平α,接受原假设
α=0.5时,p值<显著水平α,拒绝原假设
可以看出,α区域靠左边界竖线可以人为左右平移,当α=p值时,是拒绝H0的最低显著性水平(拒绝域边界值带等号)
通常α多数统计软件默认为0.05,即只要有95%把握在
为真时正确的接受
即可。
有点像极大似然的思想
看个题:
拟合分布卡方检验,可以看作观察到的分布和特定分布的拟合程度,p值度量一致性