T检验
单样本t检验
前提条件:
1)数据是连续变量,不可以是离散的;
2)相互独立;
3)不存在显著的异常值;
4)变量接近正态分布。
检验是否是正态分布
在实际问题中,更关心偏度。
下图中可发现不是正态分布
正态性检验,一般关注显著性,小于0.05,就表示异常,不是正态检验
Q-Q图(150个数据以下,不建议看QQ图)
不是正态分布,需要整理数据,去除异常值,进行单样本t检验
检验平均值是否是4
独立样本T检验
1. 样本是连续变量
2. 样本分为2组;
3. 每组是独立分布的;
4. 没有异常值;
5. 组内接近正态分布;
6. 2组的方差相等
检验正态分布
观察峰度和偏度,满足正态分布
独立样本T检验
莱文方差等同性检验,只要看显著性,显著性大于0.05,即可接受通过,认为两组样本的方差是一致的;平均值等同性t检验,Sig的值小于0.05,拒绝原假设
配对样本t检验
对同一个运动员服用某种能量前后的运动成绩,先计算前后的差值,检验是否满足正态分布
检验通过正态检验
成对样本T检验
相关性的显著性小于0.05,表示两组数据相关;配对样本检验中Sig小于0.05,拒绝原假设
方差分析
1. 因变量连续;
2. 组数在2组以上,组内,组件相互独立;
3. 无明显异常值;
4. 每组是否满足正态分布;
5. 方差齐性检验。
单因素方差分析
检验员工抗压能力与个人运动习惯的关系
显著性都大于0.05,满足正态分布
单因素ANOVA检验
显著性小于0.05,说明其中至少两组间存在显著差异
两因素方差分析
调查男女性别以及受教育程度,对其政治兴趣关注度的影响
利用残差,将数据分为6组,SPPS平台只能对分组的数据进行正态检验
拆分数据
根据性别和受教育程度分组
利用残差做因变量
满足正态分布
多因素分析
报告一般需要的内容
1. 均值
±
\pm
± 标准差;
2. 箱式图检测异常值;
3. 夏皮洛检验正态性;
4. 莱文方差齐性检验检测是否等方差
5. 观察数据,给出分析
示例
药物 | 生存 | 死亡 | 合计 | 病死率(%) |
A | 187 | 11 | 198 | 5.56 |
B | 36 | 6 | 42 | 14.29 |
合计 | 223 | 17 | 240 |
新建数据集,输入变量视图
输入数据视图
进行个案加权
使用交叉表
卡方检验
1. 总例数≥40,期望频数≥5,pearson结果;
2. 总例数≥40,期望频数≥1且<5, χ 2 \chi^2 χ2检验,需要进行连续性校正,continuity correction 结果;
3. 总例数≥40,至少两个期望频数≥1且<5,Fishers exact Test结果;
4. 总例数<40或有期望频数<1,Fishers exact Test结果。
观察A,B两种药物,1<3<5,看连续性修正的结果,0.095>0.05,即A,B两药无显著差异。
结论:A,B效果不同,但差异无统计学意义。
线性回归
判断2个变量之间的关系,一个预测另一个;
1. 自变量和因变量是连续的;
2. 自变量和因变量之间存在线性关系;
3. 观测值相互独立⇿残差不存在自相关;
4. 因变量没有显著异常值;
5. 残差满足方差齐;
6. 残差近似正态分布。
线性回归
德宾沃森是检测残差是否存在自相关;其分布在0~4之间,越接近2,观测值相互独立的可能性越大;
异常值检测,标准残差一般在3以下;删除异常值
报告内容:
1. 绘制散点图,粗略判断线性关系;
2. 残差散点图,直方图,残差方差齐,近似正态分布;
3. 修正异常值