目录
工具
- SPSSAU(我用得比较熟,但是它要钱QAQ)
- SPSSPRO(免费)
- pycharm
前两个是网页不是软件,我因为嫌弃spss的界面太丑了不想学所以数据分析多半用它们,感谢开发者www!后面那个不用多说,写python用的~
步骤
1 判断数据类型
定类数据 | 定量数据 | |
---|---|---|
大小 | 不可比较 | 可比较且有实际意义 |
统计量 | 不可计算 | 可计算且有实际意义 |
举例 | 性别、专业、是否是5G用户、黑眼红眼卷翅直翅 | 年龄、身高、体重、菌丝增长速率、进食量 |
注:在分析时,我们可能给定类数据加了label,比如1代表是文科生,2代表理科生,但数字只代表分类,没有比较意义。
2 检查正态性
数据服从正态分布是很多分析方法的前提条件。如果不满足正态性特质,则需要考虑使用其他方法或对数据进行处理。常用方法如下:
(该图源自[Pterosaur_Zero的CSDN文章],偷个小懒~)
注:不用每个方法都用一遍,选择合适的一两个确认一下就行了。
我倾向于直方图 +
if(样本量大 n≥2000)偏度-峰度检验法(样本量小也能用)
if(样本量小 n<2000)AD检验或 W检验
① 直方图
如果满足正态性,将直观地看到一个草帽形的对称图形。
注:实际数据由于样本不足等原因,图的展现可能会和后面定量计算的检验方法冲突。因此,在要求不是非常严格的场合下,差不多就行了。
操作方法:
- 自己写代码或SPSS分析
- SPSSAU→“可视化”→“直方图”
② P-P图或Q-Q图
P-P图将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图。
Q-Q图将实际数据作为X轴,将假定正态时的数据分位数作为Y轴