商业数据分析【七】数理统计与SPSS统计

T检验

  单样本t检验
  前提条件:
  1)数据是连续变量,不可以是离散的;
  2)相互独立;
  3)不存在显著的异常值;
  4)变量接近正态分布。

  检验是否是正态分布
在这里插入图片描述
  在实际问题中,更关心偏度。
在这里插入图片描述
在这里插入图片描述

下图中可发现不是正态分布在这里插入图片描述
  正态性检验,一般关注显著性,小于0.05,就表示异常,不是正态检验
在这里插入图片描述
  Q-Q图(150个数据以下,不建议看QQ图)
在这里插入图片描述
  不是正态分布,需要整理数据,去除异常值,进行单样本t检验
在这里插入图片描述
  检验平均值是否是4
在这里插入图片描述
在这里插入图片描述

  独立样本T检验
  1. 样本是连续变量
  2. 样本分为2组;
  3. 每组是独立分布的;
  4. 没有异常值;
  5. 组内接近正态分布;
  6. 2组的方差相等

  检验正态分布
在这里插入图片描述
观察峰度和偏度,满足正态分布
在这里插入图片描述
  独立样本T检验
在这里插入图片描述
  莱文方差等同性检验,只要看显著性,显著性大于0.05,即可接受通过,认为两组样本的方差是一致的;平均值等同性t检验,Sig的值小于0.05,拒绝原假设
在这里插入图片描述

  配对样本t检验

  对同一个运动员服用某种能量前后的运动成绩,先计算前后的差值,检验是否满足正态分布
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
  检验通过正态检验

在这里插入图片描述
在这里插入图片描述
  成对样本T检验
在这里插入图片描述
在这里插入图片描述
  相关性的显著性小于0.05,表示两组数据相关;配对样本检验中Sig小于0.05,拒绝原假设
在这里插入图片描述

方差分析

  1. 因变量连续;
  2. 组数在2组以上,组内,组件相互独立;
  3. 无明显异常值;
  4. 每组是否满足正态分布;
  5. 方差齐性检验。
  单因素方差分析

  检验员工抗压能力与个人运动习惯的关系
在这里插入图片描述  显著性都大于0.05,满足正态分布
在这里插入图片描述
  单因素ANOVA检验
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述  显著性小于0.05,说明其中至少两组间存在显著差异
在这里插入图片描述
在这里插入图片描述

  两因素方差分析

   调查男女性别以及受教育程度,对其政治兴趣关注度的影响
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
  利用残差,将数据分为6组,SPPS平台只能对分组的数据进行正态检验
在这里插入图片描述
在这里插入图片描述
  拆分数据
在这里插入图片描述
  根据性别和受教育程度分组
在这里插入图片描述
  利用残差做因变量
在这里插入图片描述
  满足正态分布
在这里插入图片描述
  多因素分析
在这里插入图片描述
在这里插入图片描述

  报告一般需要的内容
  1. 均值 ± \pm ± 标准差;
  2. 箱式图检测异常值;
  3. 夏皮洛检验正态性;
  4. 莱文方差齐性检验检测是否等方差
  5. 观察数据,给出分析

示例

药物生存死亡合计病死率(%)
A187111985.56
B3664214.29
合计22317240 

  新建数据集,输入变量视图
在这里插入图片描述
在这里插入图片描述
  输入数据视图
在这里插入图片描述
  进行个案加权
在这里插入图片描述
在这里插入图片描述
  使用交叉表
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
  卡方检验
  1. 总例数≥40,期望频数≥5,pearson结果;
  2. 总例数≥40,期望频数≥1且<5, χ 2 \chi^2 χ2检验,需要进行连续性校正,continuity correction 结果;
  3. 总例数≥40,至少两个期望频数≥1且<5,Fishers exact Test结果;
  4. 总例数<40或有期望频数<1,Fishers exact Test结果。
  观察A,B两种药物,1<3<5,看连续性修正的结果,0.095>0.05,即A,B两药无显著差异。
在这里插入图片描述
  结论:A,B效果不同,但差异无统计学意义。

线性回归

  判断2个变量之间的关系,一个预测另一个;
  1. 自变量和因变量是连续的;
  2. 自变量和因变量之间存在线性关系;
  3. 观测值相互独立⇿残差不存在自相关;
  4. 因变量没有显著异常值;
  5. 残差满足方差齐;
  6. 残差近似正态分布。

  线性回归
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
  德宾沃森是检测残差是否存在自相关;其分布在0~4之间,越接近2,观测值相互独立的可能性越大;
在这里插入图片描述
  异常值检测,标准残差一般在3以下;删除异常值
在这里插入图片描述
  报告内容:
  1. 绘制散点图,粗略判断线性关系;
  2. 残差散点图,直方图,残差方差齐,近似正态分布;
  3. 修正异常值

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ZoomToday

给作者倒一杯卡布奇诺

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值