0、前言:
- 这部分知识的学习主要是为了丰富大论文内容,添加一些关键实验。
- 这部分内容中主要参考了“小破站”邵利民老师的课程内容(一键三连)
1、显著性检验的理解:
- 显著性检验(test of statistical significance)用于判断结果源自随机因素还是确定性因素统计显著性检验自随机因素还是确定性因素
- 检验结论之一是“统计不显著”(statistically insignificant)说明结果源自随机因素(一般不受关注,因为没法控制随机因素)
- 检验结论之二是“统计显著”(statistically significant),说明结果源自确定性因素(重点关注)
- 理解:根据已有信息做出推测(假设),如果实际情况和预测一致,原假设成立,否则原假设不成立。
2、显著性检验的名词定义:
- 事件通过一个检验统计量(test statistic) T来描述
- 原假设(null hypothesis): 事件源自随机因素
- 根据T的分布确定大概率事件和小概率事件的区间, “大概率”称为“置信度” (confidence, P); “小概率” 称为“显著性水平" (significance level, α); P+ α= 1
- P为接受域中曲线下的面积,α为拒绝域中曲线下的面积
- 如果 T的实际取值落入接受域,那么接受原假设如果 T的实际取值落入接受域,那么接受原假设。
- 如果 T的实际取值落入拒绝域,那么拒绝原假设如果 T的实际取值落入拒绝域,那么拒绝原假设。(原理:小概率事件在一次事件中不会发生)
- 注意:不论是拒绝原假设还是接受原假设,这两个结论都不是100%正确,这就是显著性检验里面的两类错误。
- 小概率事件与原假设可能相容,因此存在“拒真错误”拒真错误:原假设成立、为“真”,却(因小概率事件发生)被拒绝犯“拒真错误”的概率:表示为 α,即显著性水平。
- 大概率事件与原假设可能不相容,因此存在“存伪错误”存伪错误:原假设不成立、为“伪”,却(因大概率事件发生)被接受犯“存伪错误”的概率:表示为β;一般不可知。
- 对于“拒真错误”和“存伪错误”,减小其中一个,另一个就会增大,即不能同时减小犯两类错误的概率。
综上所述:在实际检验中,要控制α,不能让其过大,一般控制在0.05或者0.01【因为拒真错误对于科研危害较大,所以尽量不能犯拒真错误】,虽然β不可知,但是α可知,且两者是反比关系,一个变大一个就会变小。
3、显著性检验的类型:
-
双侧检验
-
单侧检验
4、显著性检验的实施:
- 方法一:使用临界值,验证统计量t超出临界值(落入小概率区域),则统计显著,否则(落入大概率区域)统计不显著。
- 方法二:使用P值
- 图示解释(以左侧单侧检验为例):
- 总结:不论是单侧检验还是双侧检验都有一个普遍规律,对于统计“显著”的情况,P值小于α;对于统计“不显著”的情况,P值大于α;
- 定义归纳:P-值(P-value)是当原假设为真时,出现比观测值更加极端的结果的概率。P-值与显著性水平a具有相同的涵义,所以也称为“观测到的显著性水平”
- 图示解释(以左侧单侧检验为例):
- 总结:
- 说明:在之前统计软件不流行的时代,重点还是使用t值的判断方法,原因是P值不好计算,随着统计软件的普及,更多的是使用P值来分析。目前用统计软件来完成显著性检验没有什么难度,只需要输入数据就可以获取显著性分析结果。重点是对显著性检验原理的理解和对结果的分析。
- 注意:如果结论是“统计显著”,那么该结论的可靠性等于(1 - α)在不改变结论的前提下,选择小 α 进行检验。如果结论是“统计不显著”,那么一般无法获得该结论的可靠性(1-β)。在不改变结论的前提下,选择大a进行检验
总结:
- SPSSPRO:一款在线数据分析软件,好处是你不用再下载传统的数据分析软件,就能避免软件下载时的安装包获取,环境配置,以及软件学习成本的各种不便因素。