H0:样本与总体或样本与样本间的差异是由抽样误差引起的;(两者不存在差异)
H1:样本与总体或样本与样本间存在本质差异 ;(两者存在差异)
1.假设检验思想
- 进行假设检验时, 假定原假设H0为真;
- 寻找反驳的证据,
- 如果有足够的证据反驳原假设,则拒绝原假设, 接受备择假设H1.
2.假设检验步骤
- 确定要进行性检验的假设(要对齐进行试验的断言)
- 假定H0为真, 选择检验统计量(最有效地对断言进行检验的统计量)
- 确定用于做决策的拒绝域(使用某种确定性水平)
- 求出检验统计量的p值(在假定断言为真的情况下, 试验结果的可信程度)
- 查看样本结果是否位于拒绝域内(了解试验结果是否位于确定性限值范围中)
- 作出决策
拒绝域
拒绝域: 给出反驳原假设的最极端证据的一组数值. P(X<c) < α
临界值c: 拒绝域的分界点
显著性水平α: 为求拒绝域, 先确定显著性水平. 表明你希望在观察结果的不可能程度达到多大时拒绝H0. α越小,为了拒绝H0, 样本结果需要达到的不可能程度越高.
- 检验必须保证公正: 在研究证据之前,必须根据所需要的证据水平确定显著性水平, 且不能更改.
- 单尾检验与双尾检验: 如果备择假设包含一个≠, 则需要使用双尾检验
3.p值
概念: 为取得样本中的各种结果或取得拒绝域方向上的某些更为极端的结果的概率. 通过p值确定是否拒绝原假设.
算法: 利用样本进行计算, 判定结果是否落在假设检验的拒绝域以内.(具体用哪种方法, 取决于拒绝域和检验统计量)
如果p值位于拒绝域中,则有充足的理由拒绝原假设;如果p值位于拒绝域以外, 则没有充足的证据.
4.可能出现的错误
第一类错误: 错误地拒绝真原假设,恰好就是“小概率事件”发生的概率α
P(第一类错误)=α
第二类错误: 错误地接受假原假设
P(第二类错误)=β
控制错误:在实际应用中,一般原则是:控制犯第一类错误的概率,即给定α,然后通过增大样本容量n来减小β。
求第二类错误概率β:
1.检查是否拥有H1的一个特定数值(没有这个数值则无法计算第二类错误概率)
2.求检验拒绝域以外的数值范围(如果检验统计量已经标准化, 则该数值范围需要进行逆标准化)
3.假定H1为真, 求得到这些数值的概率(用H1对检验统计量进行描述)
5.假设检验的功效
功效=1-β
定义:当两个总体参数的确存在差异,所使用的统计检验能发现这种差异的概率(在H0为假时,成功拒绝H0的概率)。
- 样本量越大,功效越大;
- α越大,功效越大。