本次学习涵盖知识点:假设检验
本次学习参考内容:
1.可汗学院统计学公开课 47-61集
2.《深入浅出统计学》对应知识点翻一翻
知识点清单
1.假设检验
假设检验的定义:通常设定两个假设,零假设备择假设,然后通过拒绝零假设,来接受备择假设,从而完成检验。通常假设零假设是正确的,如果零假设正确,得到这个样本的概率是多少,如果这个概率非常小,我们就认为零假设不正确,于是拒绝零假设,而认为备择假设是正确的。
例子:假设某一药物的有效时间是1.2s,现在对这种药物做出了一些改变,抽取100个改变后的药物样本,测得其均值为1.05s,标准差为0.5s,让你判断药物改变后的有效时间是否改变。
解答:我们想证明药物改进后的有效时间是改变的,所以我们设零假设:药物改变后有效时间没有改变,u=1.2s,备择假设:药物改变后有效时间改变了,即。如果零假设正确,则抽烟分布的均值,抽样分布的标准差。在n足够大的情况下,用样本标准差代替总体标准差,得到了抽样分布的样本均值和标准差,计算得到1.05s的概率有多少,,Z分数是3,在均值3个标准差之外的概率是极小的,3个标准差内的概率是99.7%,所以拒绝,接受了备择假设,得到零假设这种极端情况的概率称作p值。通常认为p5%,就拒绝假设。
2.单侧检验和双侧检验
单侧检验就是只看抽样分布一侧的情况。双侧检验是两边都看,比如上面的药物效果是否变化,只要与原均值不同都认为效果改变,而不论它是增加还是减少有效时间,而单侧检验就是,:药物无效,u=1.2s,:药物有效降低有效时间,u<1.2s,这样就是一个单侧检验。
3.Z统计量和t统计量
当样本容量很小时,样本均值抽样分布不应该采用正态分布,而应采用t分布。Z统计量服从正态分布,而t统计量服从t分布,样本容量30为界限。
,样本均值,抽样分布的样本均值,抽样分布的标准差,,为总体标准差,n是样本容量,时,样本标准差是很好的总体标准差的估计值。
t统计量,s是样本标准差。
4.第一型错误和第二型错误
若零假设事实上成立,但统计检验的结果不支持零假设,拒绝了零假设,这种错误称为第一型错误。若零假设事实上不成立,但统计检验的结果支持零假设,即接受了零假设,这种错误称为第二型错误。
5.随机变量之差
X、Y是相互独立的两个随机变量