最近需要完成市场调查大赛,就打算把问卷分析的知识点整理一下,我的这类笔记是根据麦小哲博主的数据和《问卷数据-破解的六类分析思路》记录的,捋顺一下思路。
一、样本背景分析
设立样本背景信息和针对研究题目的筛选题项。一般用频数分析、描述性分析的方法描述样本的基本背景信息,如年龄,学历,性别等
二、样本特征、行为分析
设立样本特征信息和基本态度题项。一般也是用频数分析,描述性分析,图形展示来分析样本的特征行为,还可以用题项的平均值来描述。
上述一般是非量表题项,一般用来做差异性分析,建议题量在3-8个。
三、核心题项部分总述
影响关系研究中要提出自变量对因变量的影响,问卷设置了若干核心题项进行相关研究。这部分题项需要有量表参考依据或者直接引用,以免导致后续信度效度不达标;自变量可能有K 个不同方面,每一方面尽可能用4-7个题项表示,能更好表达信息;若要研究影响关系,则因变量也要有对应的测量题项;若有反向题,建议修改为正向题或者反向处理结果;若涉及中介效应或调节效应,对应变量题项需要有理论文献参考,若要研究中介效应或者调节效应,则中介变量或调节变量需要有对应题项。
分析方法:信度分析,效度分析,相关分析,回归分析,因子分析,聚类分析等
四、指标归类分析
探索性因子分析功能:提取因子;效度验证;权重计算(先略,后面我再补充)。
1.提取因子(提取因子和效度验证步骤一致,本文用麦小哲博主的数据举例)
step1.分析-降维-因子分析
step2.将分析变量选入变量框
step3.设置相关选项-确定
【描述】-KMO和Bartlett的球形度检验-继续
【提取】-输入提取因子的数量-继续:若确认分为几个变量就填提取几个因子,若无法确认也可基于特征值大于1 来进行后续判断
【旋转】-最大方差法-继续
【选项】-按大小排序-排除小系数(一般排除0.4以下的数)
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
kmo>0.7且Bartlett球形检验p值为0,说明适合做因子分析。
共同度通常大于0.4为标准,若小于0.4,说明因子不能很好地表达题项信息。根据此表格可以适当删除题项。
每个因子旋转后的方差均大于10%,前四个因子累计方差解释率为76.882%,说明因子分析结果良好。
上表展示了题项与因子的对应关系,并设置了不显示低于0.4的因子载荷系数值。上表说明题项就各个因子的测量比较好。若不是已经分好因子的情况下,通过上表格归纳出各题项与因子的紧密关系。
2.权重计算
除了提取因子完全一样的步骤外,【选项】-保存为变量-显示因子得分系数矩阵..
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
上表展示了各题项与各因子间的得分系数,反过来说,就是各题项在某因子中权重。
五、信度分析
信度分析的目的在于研究样本数据是否真实可靠,受访者是否真实回答了问题或者题设不规范可能导致信度不达标。信度分析分为四类,用一个就行:系数;折半信度;复本信度;重测信度。
1.系数,内部一致性系数(问卷信度分析常用)
系数最好在0.8以上,0.7-0.8可以接受,若低于0.6,则需要考虑修改量表。一般来说,变量对应的题项越多,样本量越大,该值会越大。
用作问卷前测时,结合CITC和删除某项后系数值来判断是否修正。一般citc小于0.4,或者删除某项后系数值反而上升0.1左右,考虑修正或者删除该项。
step1.分析-标度-可靠性分析
step2.将同一因子紧密相关的题项或者说潜变量相关题项选入项中
step3.若要进行前测 选择【统计】-删除项后标度-继续
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
系数值大于0.8,信度水平较高
PU1题项被删除后,系数提高0.01,与原来整体系数差别不大,其他被删除后,系数降低,因此三个题项不能被删除,信度水平较高。
2.折半信度
折半信度是将变量对应的题项按照单双号分为两组,计算两组题项的相关系数,然后通过公式计算得到折半信度系数值,以此衡量信度质量。
step1.分析-标度-可靠性分析
step2.将同一因子紧密相关的题项或者说潜变量相关题项选入项中-模型-折半
step3.【统计】-删除项后的标度
3.复本信度
4.重测信度
六、效度分析
效度分析的目的在于判断研究题项是否可以有效地测量研究人员需要测量的变量,即测量问卷题项是否准确有效。效度分析:内容效度;结构效度;校标效度
1.内容效度
(1)专家判断。研究题项设计是否有参考量表、获得专家的认可
(2)问卷前测。通过前测问卷并结合结果进行题项的修正
内容效度直接用文字描述以上两方面的情况来说明问卷的有效性。
2.结构效度
(1)探索性因子分析。通常使用探索性因子分析进行效度水平判断(与上文二、中的步骤一样),将SPSS生成的结果与专业预期进行对比,若基本一致,则说明效度较好。若严重不一致,要进行修正或删除。常常需要进行多次探索性因子分析,来修正题项以保证正式研究时对应关系良好。另一种情况是若量表具有很强的权威性,则不需要使用探索性因子分析进行效度验证。
(2)验证性因子分析。
验证性因子分析需要借助AMOS等结构方程模型进行测量。其对问卷量表的质量、样本量、样本质量有较高要求
3.校标效度
一般是与权威问卷的相关性分析,用的较少。
七、研究变量描述性分析
目的在于研究样本对变量的整体态度情况,一般可以用与变量相关题项的平均值或者中位数或用折线图来展示变量的平均值排序情况
八、研究变量相关关系分析
通过相关分析研究变量之间的关系情况。通常一个变量由多个题项表示,在进行相关分析之前需要计算多个题项的平均值来代表对应变量。相关分析:pearson相关系数(变量呈现正太性或近似正态性时使用,一般研究基本用此);spearson相关系数(不常用)。
step1.转换-计算变量
step2.输入目标变量名称-输入计算公式
step3.分析-相关-双变量-选择变量-相关系数
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
相关性检验显著性p值为0,说明有相关关系;相关系数绝对值>0.6,表示强相关关系,>0.4,表示较强相关关系,<0.4,说明相关密切程度较低。
九、研究假设验证分析
分析方法多样,本文缺乏数据,且是一个全新的板块和阶段,篇幅较大,此文不叙述,小编有时间会在其他文章中展现。
(1)多元线性回归分析
(2)简单线性回归分析
(3)SEM结构方程
(4)logistics回归分析(因变量是分类变量)
十、差异分析
差异分析通常有三种分析方法:方差分析;t检验;卡方分析
1.方差分析
(1)单因素方差分析
(2)多因素方差分析
2.t检验
(1)独立样本t检验
(2)配对样本t检验
(3)单样本t检验
3.卡方分析