问卷分析(一)

Tips:问卷设计好了之后,一般要先进行预调查,收集到数据后进行题目区分度检验和信效度检验,合格之后才能发放给调查对象。在正式发放并回收问卷后,一般依然需要再做信效度分析(当然,不重要的问卷调查都忽略了预调查,可能只是随便编一编话术。信效度分析是每份问卷必须的)

一、影响关系类研究分析

  • 这类分析思路倾重于关系,并且是影响关系的研究。比如各种因素对员工薪酬满意度的影响关系研究、员工离职倾向影响关系研究、消费者重复购买意愿影响关系研究、大学生手机依赖影响关系研究等。
  • 此类分析思路框架大部分题项应该为量表题,小量题项为非量表题。
    在这里插入图片描述

(一)样本背景分析

  • 对收集数据进行基本的频数分析,比如统计性别,年龄,学历的分布情况如何等。
  • 其目的在于对样本背景基本信息进行描述,此处会使用频数分析去统计样本基本特征情况,比如性别比例分布情况,学历,收入区间或婚姻状况分布情况等;。如果年龄为填空题形式统计具体数字,则会使用描述性分析即计算平均值,或者中位数形式去描述样本年龄分布结构情况。
  • SPSS操作方法:
    • 【分析——描述性统计——频率】
      在这里插入图片描述
    • 【图表——条形图——频率/百分比】
      在这里插入图片描述
    • 结果(1是男生,2是女生)
      在这里插入图片描述

比如年龄,【分析——描述统计——描述——选修——选择均值和标准差】

(二)样本特征分析

在这里插入图片描述

  • 对于样本基本特征,行为情况或者基本态度的统计,最常见是使用频数分析方法,通过计算各个选项的选择频数和百分比进行分析。

  • 如果相关样本基本特征的题项是使用定量数据表示,比如年龄,或者收入是具体数字,则需要使用描述性分析方法即计算题项的平均值或者中位数进行分析。

  • 如果涉及多选题,通常会将多选题各个选项的选择频数和百分比汇总成表格,也或者会使用条形图展示样本的选择情况并进行分析(如果只是想绘制图,个人觉得excel会更快)

  • 如样本基本态度的question:
    频繁使用手机后您的感受是(多选题)
    A.快乐 B.兴奋 C.后悔 D.难受 E.没感觉

在分析时,依然是选中该选项为1,未选中为0,可计算每个选项的频数和百分比,以了解不同选项的选择情况;也可以将多选题与其他变量进行交叉分析,例如性别、年龄等。如想了解性别在这个多选题上的差异,具体步骤如下:

  • 【分析——描述统计——交叉表】

在这里插入图片描述

  • 行选中自变量性别,列选中因变量(多选题选项)
    在这里插入图片描述
  • 在交叉分析中,卡方检验用于确定两个分类变量之间是否存在显著的关联性。结果分析:
    在这里插入图片描述已知收到数据184份,上图表示一共有154人未选中“兴奋”选项,30人选中;其中有9个男生和21个女生选中“兴奋”。同时,通过卡方检验的Sig值=0.899>0.05,统计结果不具有显著性,说明性别和“兴奋”这两个变量之间没有关联,即频繁使用手机后产生的“兴奋”感与性别无关。

(三)指标回归分析

  • 影响关系研究时,问卷中通常会涉及非常多的量表题,如果量表题具体应该分成多少个维度,并不完全确定,研究者可以使用探索性因子分析,让软件自动找到题与因子的对应关系,以便得到更为严谨科学的结论。探索性因子分析在此步骤的目的在于找出题与因子对应关系,用较少的几个因子去浓缩概述表达多个题项信息。( 备注:一个维度由多个标题项表示,想将多个标题项概括成一个整体,此时需要使用SPSSAU中“生成变量”的“平均值”功能即可)

  • 如果有着充足理论依据证明题应该分为几个维度,每个维度与题的对应关系也有较强理论来源时,不需要使用此分析步骤。

  • 探索性因子分析有提取因子、效度验证以及权重计算的功能(没遇到所以还没有案例)
    在这里插入图片描述

(四)问卷信度分析

  • 信度分析用来评价量表的稳定性和可靠性,在对问卷数据进行分析前,需要对量表的稳定性程度进行检验。
  • 信度高但效度并不一定高,而信度低时效度一定低。因此信度分析会放在效度分析的上一部分
1.一般分类

在这里插入图片描述

  • Cronbach’s α 信度系数,即内部一致性系数。此类信度分析最为常见,基本上所有问卷信度分析均会使用此类分析。
    • 若α大于0.9,认为量表信度佳
    • 若α处于0.8至0.9之间,可认为量表信度合适
    • 若α处于0.7至0.8之间,表示该量表可以接受
    • 若总量表的α小于0.7或者分量表的α小于0.6,则认为量表信度不可靠,须再次制定量表题目。
  • 折半信度
    • 折半信度是将维度对应的题项按照单双号分成两组,通过计算两组题项间的相关系数,进而再通过公式计算得到折半信度系数值,并且进行衡量信度质量。心理学、教育学类经典量表常使用此类方法进行信度质量衡量。判断标准可参考 α 信度系数的衡量标准。
  • 复本信度
    • 复本信度是同样一组样本,一次性回答两份问卷,比如同样一组学生连续做两份同样难度水平的试卷。然后通过计算两份样本相关系数,从而进行信度质量衡量,由于实际操作过程中有诸多客观条件限制,此类分析方法较为少见
  • 重测信度
    • 重测信度指同样的样本,在不同的时间点回答同样一份问卷。继而计算两份数据的相关系数,并且通过相关系数去衡量信度质量。重测信度可以评估时间差异带来的误差,但实际操作中有诸多不便,因而此类分析使用较少。
2.按照评价对象的不同
  • 信度可以分为内在信度和外在信度
    • 其中外在信度也叫重测信度,是指用同一份问卷在不同时间对同一对象进行重复测量
    • 内在信度用来衡量量表中的一组测量问题(分量表)是否反映了同一个构念(维度),通常用Cronbach’s α系数来衡量,信度系数越接近于1,量表的内在信度越好;信度系数在0.7到0.9之间,是可以接受的,如果信度小于0.7,则需要对量表进行重新修订。

在实际研究中一般通过对内在信度来衡量量表的稳定性与可靠性程度,需要分析问卷的信度(其实只有量表才会有信效度分析),还需要分析每个维度下的题项信度(分量表),以确定哪些题是否需要删除(如果题项删除后的量表整体信度系数比原来的信度系数高,则表示题项应该删除)

在开始使用数据前,首先要将反向题项重新编码计分:【转换——重新编码为相同变量】——【旧值和新值】——【1->5】

3.案例:大学生手机依赖影响因素研究
  • 因变量有6道题目
    • 【分析——度量——可靠性分析】
      在这里插入图片描述
    • 将因变量的六道题移入到“项目”中,选中“如果项已删除则进行度量的选项”
      在这里插入图片描述
    • 结果:
      在这里插入图片描述可以看出克隆巴赫α=0.139,远远小于0.6,可以看到,删除36、37两道题后该系数都增加了,因此可删除这两道题后再进行信度检验
      在这里插入图片描述
      此时克隆巴赫α=0.437,依然小于0.6,上图表示删除“38题必须处理事情”这个问题后,该系数上升,因此可以删除它再检验
      在这里插入图片描述
      同理,再删除39题再检验
      在这里插入图片描述
      此时克隆巴赫α系数值为0.749,处于0.7至0.8之间,该因变量分量表可以接受

(五)问卷效度分析

  • 即研究题项是否有效地表达各维度概念信息,即测量题项是否准确有效
    在这里插入图片描述
1.内容效度
  • 内容效度是指问卷题项对相关概念测量的适用性情况,简单来讲即题项设计合理性情况。
    • 内容效度可以从两个方面进行说明,第一是专家判断,专家具有权威性,因此专家对问卷进行判断并得出肯定结论后也即说明问卷具有有效性,此处专家是指行业内专家,或者参考文献,也或者权威来源等。
    • 第二为问卷前测结果,通过对问卷前测并结合结果进行题项的修正等工作以充分说明问卷的有效性。
  • 在具体分析过程中,内容效度通常是指研究题项的设计是否具有参考文献出处,是否有经过老师(专家)的认可,以及是否得到同专业相关人员比如同学的认可等。以及研究人员是否对问卷进行修正工作,比如对问卷进行前测后发现问题,并做出修正工作。内容效度是通过文字性进行描述说明,而并非 SPSS 软件进行的统计方法,对于问卷研究来讲,基本上均需要进行内容效度说明。
2.结构效度

结构效度指测量题项与测量维度之间的对应关系,其测量方法有两种

  • 探索性因子分析
    • 是当前使用最为广泛的结构效度测量方法。使用探索性因子分析进行效度验证时,应该以量表为准,对变量或者量表分别进行分析(比如分别针对自变量 X,因变量 Y 进行),而不能将所有变量或者量表同时放入进行探索性因子分析。
    • 具体步骤:

在这里插入图片描述
(1)因子分析的前提条件鉴定

  • 由于因子分析是从众多原始题项中构造出少数具有代表意义的因子,因此,原有题项间应具有较强的相关性,否则无法找出公共因子。
  • 一般利用KMO检验和巴特利特(Brrtlett)球形度检验来判定量表整体是否适合进行因子分析
    • KMO检验是比较各原始题项间的相关系数,越接近1越适合做因子分析;0.9以上非常适合,0.8适合,0.7一般,0.6不太适合,0.5以下不适合。如果KMO值低于0.5,说明样本偏小,需要扩大样本数。
    • 巴特利特球形度检验主要观察题项之间的相关矩阵是否为单位矩阵,从而判定原始题项变量间是否存在相关关系。当显著性水平(Sig.)<0.05时,存在共同因子。
  • 二者需要同时满足才可说明整份量表问卷可以进行因子分析
  • 【分析——降维——因子分析——把自变量X的所有题项移入右边——抽取——选主成份——基于特征值(软件会自动默认以特征根值大于 1 作为标准进行设置
    因子个数)/因子的固定数量(这取决于最开始设计问卷的时候,设计了多少个维度)】

(2)因子提取

  • 主要采取采用主成份分析法,以较少的成分解释原始变量方差的较大部分。在社会科学领域,认为所抽取出的共同因子累积解释变异量达到60%以上就说明所抽取的共同因子是可靠的

  • 【分析——降维——因子分析——把自变量X的所有题项移入右边——描述——选择KMO和球形的检验】
    在这里插入图片描述

    • 该表格分别列出特征根值,方差解释率和累积方差解释率值,并且包括旋转前和旋转后的结果,第 2~第 4 列为旋转前的结果,最后 3 列为旋转后的结果
    • 方差解释率代表某个因子代表的信息量。上图中,比如为 15.150%则说明该因子可以代表所有题项 15.150%的信息。总方差解释率代表全部因子可以解释所有题项的信息量情况,该值并没有固定标准,通常情况下大于60%即说明分析结果较好,50%可以接受。
    • 如果研究者不主动设定因子个数,软件会自动默认以特征根值大于 1 作为标准进行设置
      因子个数,而本案例主动设置成 6 个因子,因此旋转前特征根值会出现小于 1 的情况,但通常来讲旋转后的特征根值会大于 1。本案例共提取到 6 个因子,其旋转后的方差解释率分别为: 15.150%, 14.205%, 13.800%, 11.931%, 10.461%和 10.291%,总共累积方差解释率为75.837%,代表总共 6 个因子可以代表所有题项 75.837%的信息量整体,说明探索性因子结果良好。

(3)因子旋转+计算得分

  • 进行因子旋转的目的在改变题项在各因子上的负荷量的大小,使得旋转前较大的因子负荷量得更大,较小的变得更小,避免转轴前题项在每个因子的负荷量都差不多(这样就难以分辨将该题项归到哪一因子中),一般采用最大方差法进行旋转
  • 【分析——降维——因子分析——把自变量X的所有题项移入右边——旋转——最大方差法】
    在这里插入图片描述在这里插入图片描述
  • 结果分析:
    在这里插入图片描述在这里插入图片描述

①表格里面的数字均为因子载荷系数,因子载荷系数代表题项与因子之间的紧密程度,它的取值范围为-1 到+1 之间,绝对值越大,说明其与因子之间的紧密关系程度越高,通常该值以 0.4 作为标准,0.4 以上则说明题项与因子之间的关系比较紧密,比如为 0.806,则说明对应题项与对应因子有着非常紧密的关系。

分析思路有两种:
(1)以题项为准,找到某题项横向对应过去的因子载荷系数,绝对值最大时就说明此题项与某因子的紧密程度最高,比如 Q1 对应有 6 个因子载荷系数,而其对应因子 2 时绝对值最大为 0.775,因此 Q1 这一题项归并为第二个因子较为合适
(2)以因子为准,找到某因子纵向对应的所有因子载荷系数中值较大的题项(通常为大于0.4),比如第一个因子对应 Q11,Q12 和 Q13这三个题项时,因子载荷系数绝对值较大,因此这三个题项归并为第一个因子较为合适

本案例最终提取出 6 个因子,因此会有 6 列数字。第一列数字代表第一个因子分别与 15个题项的对应关系,明显地可以看出,第一个因子分别与 Q11,Q12 和 Q13 这三个题项的关系较为密,此三个题项对应第一个因子时,因子载荷系数值分别是 0.806,0.836 和 0.645,也即说明第一个因子主要涉及 Q11,Q12 和 Q13 这三个题项,第一个因子应该结合这三个题项进行命名,本案例将其命名为个性化服务,另外,第一个因子对应 Q1 的因子载荷系数值为 0.239,说明第一个因子与 Q1 之间紧密程度很低

③两种常见问题

  • 第一种问题为因子与题项对应关系出现混乱,“张冠李戴”,即完全不相关的几个题项同属于一个因子,此时应该考虑调整因子个数,以及进行删除题项处理。
  • 第二种问题为某个题项与多个因子有较高的紧密程度,说明该题项与多个因子均有着紧密关系,“纠缠不清”,针对此类题项,通常会进行删除处理,或者结合具体情况进行主观判别处理,将其归并到更为合适的因子里面。

Tips:

有时候可能还会做【项目分析:题目区分度检验】,以测验项目对不同考生能力水平的鉴别程度。在某一测验中,若项目的鉴别力高,则水平高的被试得分高,水平低的被试得分低。主要通过临界比值法来检验,达到显著性水平的题项说明题项具有较高的鉴别度,能够鉴别不同受试者的反应

在这里插入图片描述

参考书籍:《问卷数据分析 破解 SPSS 的六类分析思路》,由衷感谢周俊作者解开了我对这部分的疑问。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值