SPSS数据分析中出现的常见问题总结

总结最近数据分析过程中遇到的一些问题的思考

1.问卷中多选题的录入与分析
2.数据分析流程的第一步:对所分析的样本数据本身的特征结构进行预分析
3.根据数据中的某个因素的几个水平来分析数据总体的差异性。
4.根据数据中的变量之间的相关性,了解数据的内部关系,并建立模型。
5.数据的降维处理。
6.结构方程模型的运用。
7.时间序列的分析,主要运用在经济模型中。
8.面板数据的处理。

* 在接单的过程中发现,SPSS主要适用于横截面数据的处理,大多数集中在问卷调查的分析上 *

* 对于时间序列的分析主要使用Eviews和Stata两个软件,面板数据的处理集中于Stata *

* 由于SPSS软件单机处理数据量受到限制,可以处理数据量不大的机器学习算法,所以个人认为处理机器学习的问题用Python处理 *

问卷中多选题的录入与分析

对于多选题的录入,常见的方法有两种:多重二分法和多重分类法。多重二分法 是指对每一个选项都定义一个变量,这些变量都是只有两个取值,分别代表选择和未选择。多重分类法就是将多选题当做单选题来选,每一个变量空格填写其中的一次选项的选择,最保险的做法就是多选题有多少个选项,就设置多少个变量
多重二分法适用于多选题选项个数不多的多选题,多重分类法适用于多选题选项数量多且有些选项几乎不被选上的情况

设定多选题变量集

由于多选题在SPSS中被判定为一个一个零散的变量,需要人为将整个多选题设置为一道多选题,此时在SPSS中的操作为:分析-多重响应-定义变量集定义多重变量集

将需要组成多选题的变量选进集合中的变量,对于多重二分类问题在变量编码方式上选择二分法,计数值填写表示选中的值;对于多重多分类问题选择类别,范围填写实际问卷中的数值范围。最后将多选题的名称,对多项题解释说明的标签填写完毕后,点击添加按键,完成多选题的定义。

多选题的分析处理

通过分析多选题中每个选项被选择频率和交叉表格。通过使用频率分析和交叉表格分析:SPPS操作为分析 - 多重响应 - 频率或交叉表格。交叉表格频率分析

频率分析
将定义好的多重二分类多选题选入表格,并设置缺失值为在二分集内按照列表顺序排除的个案,如果是多重多分类问题,缺失值设置为在类别内按照列表顺序排除个案。
* 交叉表格分析 *
在交叉表格分析中,将问题的影响因素放入行中(例如性别的影响,学院的影响等),将多选题(多响应集)放入列,将额外层级放入层(如年级,学历等)。然后分别点击行与层内的变量,点击定义范围为其范围设定区间,如性别变量1代表男,2代表女,范围就是(1,2)。

频数分析结果

  • 3
    点赞
  • 65
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值