如何正确整理你的数据格式?

191 篇文章 30 订阅
161 篇文章 21 订阅

数据格式,直接影响着分析结果是否准确。小编最近也收到一些关于“数据格式”的提问,不知道自己的数据应该整理成什么格式上传分析?

 

正好在这里统一分享几种常见的数据格式,包括问卷数据、实验数据、时序数据、面板数据以及一些特殊数据格式。希望今天的文章,能够帮助你解决数据格式方面的困扰。

 

一、问卷数据

 

问卷数据是大家最常会用到的。此类数据的特点是:一行代表一个样本,一列代表一个属性。

 

这类格式携带着所有原始的数据信息,适用于各种分析方法。推荐大家将数据整理成此类格式。

 

多选题

 

问卷数据可能涉及多选题录入。单选题录入就是简单的一个问题为一列。根据答题者的选项,选择哪个选项就把相应的序号填入即可。

 

录入多选题时,要将多选题每一个选项看作一个单选题。选择录入为1,不选择录入为0。有几个选项就要录入几列。

 

开放题

 

除了单选题、多选题,问卷研究中还有一类开放题型,如填空题。

 

文本格式系统无法直接分析。如果是在问卷平台中生成的数据,建议大家导出[数字格式]的数据,再上传到系统进行分析。

 

如果是手动录入,建议先在EXECL里整理,把意思相近的答案归为一类提取出关键词表示,这样后续可以采用频数、词云分析等。

 

词云

 

二、实验数据

 

实验数据常见有两种:一种是加权数据格式,一种是配对数据格式

 

加权数据格式,这类数据常见于医学研究中。此类数据是整理的汇总统计数据,不能直接分析。一定要先进行加权处理。

 

 

加权数据的特点是数据中一定有:两个变量(“组别”和“疗效”)各占一列,还有一列表示频数(加权项)。

 

分析时,需将加权项放入加权项【可选】框里。

 

所有数据中,只有定类数据才能整理成加权格式,因此,这类数据只能应用在一部分研究方法上。SPSSAU中支持加权数据的研究方法包括如下:

 

 

配对数据格式,常见于配对实验设计中,涉及的研究方法包括配对t 检验,配对卡方等。可比较实验组和对照组数据的差异或干预前后数据的差异。

 

 

配对数据的特点为:行数一定完全相等并且只有两列。分析时一定要特别注意。

 

三、时间序列数据

 

时间序列数据的格式包括时间和实际分析项共两列。此类数据有明显的时间顺序,且顺序不能更改,一定是从上至下日期递增,中间不能有间隔。

 

 

四、面板数据

 

面板模型是针对面板数据进行分析,面板数据是一种特殊的数据格式。

 

这类数据的特点是可以同时取得时间和个体两个维度的数据。

 

使用SPSSAU进行分析时,需要注意录入个体ID(公司编号)和时间(年份)这两列数据。

 

个体ID’就是上图中的‘公司编号’,‘时间’就是‘年份’。‘公司编号’和‘年份’两项共同用于提示系统当前为面板数据。

 

五、特殊数据格式

 

还有一些比较特殊的数据格式。如综合评价里的模糊综合评价、灰色关联法等。

 

模糊综合评价数据格式

灰色关联法数据格式

 

建议使用这些方法之前,参考帮助手册中的格式说明或视频教程。

 

同时帮助手册中也提供了多种数据格式说明,大家可以直接搜索进行查看。

 

 

-END-

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值