【数模整理2】数据分析那些事儿——相关分析

本文介绍了数据分析中的正态性检验,包括直方图、P-P图、Q-Q图、偏度-峰度检验法和AD/W检验,并提供相关工具如SPSSAU和SPSSPRO的操作指南。此外,还讲解了查看总体趋势、异常值处理及如何进行相关系数计算,以评估变量间的相关性。
摘要由CSDN通过智能技术生成

工具

  • SPSSAU(我用得比较熟,但是它要钱QAQ)
  • SPSSPRO(免费)
  • pycharm

前两个是网页不是软件,我因为嫌弃spss的界面太丑了不想学所以数据分析多半用它们,感谢开发者www!后面那个不用多说,写python用的~

步骤

在这里插入图片描述

1 判断数据类型

定类数据 定量数据
大小 不可比较 可比较且有实际意义
统计量 不可计算 可计算且有实际意义
举例 性别、专业、是否是5G用户、黑眼红眼卷翅直翅 年龄、身高、体重、菌丝增长速率、进食量

注:在分析时,我们可能给定类数据加了label,比如1代表是文科生,2代表理科生,但数字只代表分类,没有比较意义。


2 检查正态性

数据服从正态分布是很多分析方法的前提条件。如果不满足正态性特质,则需要考虑使用其他方法或对数据进行处理。常用方法如下:
在这里插入图片描述
(该图源自[Pterosaur_Zero的CSDN文章],偷个小懒~)

注:不用每个方法都用一遍,选择合适的一两个确认一下就行了。

我倾向于直方图 +
if(样本量大 n≥2000)偏度-峰度检验法
(样本量小也能用)
if(样本量小 n<2000)AD检验或 W检验

① 直方图

如果满足正态性,将直观地看到一个草帽形的对称图形。
注:实际数据由于样本不足等原因,图的展现可能会和后面定量计算的检验方法冲突。因此,在要求不是非常严格的场合下,差不多就行了。
在这里插入图片描述
操作方法:

  • 自己写代码或SPSS分析
  • SPSSAU→“可视化”→“直方图”
    在这里插入图片描述

② P-P图或Q-Q图

P-P图将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图。
Q-Q图将实际数据作为X轴,将假定正态时的数据分位数作为Y轴࿰

  • 8
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值