数据分析
文章平均质量分 84
spssau
这个作者很懒,什么都没留下…
展开
-
毕业论文问卷分析思路
很多同学会通过收集问卷的方式获取论文研究需要的数据,但是收集到的问卷应该如何分析呢?问卷一般可以分为两类:非量表类与量表类问卷。不同类型的问卷有不同的分析思路,今天和大家探讨一下拿到一份问卷后,一般的分析思路是怎样的。原创 2023-10-31 15:09:03 · 345 阅读 · 0 评论 -
倾向得分匹配案例分析
倾向得分匹配法是通过对样本建模(logit模型)得到Pscore值,通过Pscore值为处理组在控制组中找到最接近的样本,从而进行研究的。PSM的优点在于可以控制干扰因素的影响、提高研究的证明力度;但其缺点也不可忽视,例如PSM需要样本量大、可能并非所有样本都能匹配成功,所以导致匹配后引起的样本量的损失问题不能忽视,甚至无法确定匹配后的样本是否能代表原有研究样本。原创 2023-02-27 11:10:00 · 1191 阅读 · 0 评论 -
正态性检验全流程
在实际研究中,很多分析方法的前提条件都要求数据满足正态性特征,所以在分析前需要进行正态性检验。正态性检验的方法包括统计检验法、描述法、图示法三大类。其中,统计检验法对于数据正态性要求最为严格,绝对正态数据一般很难达到。一般使用描述法或图示法进行检验,数据近似满足正态性特征即可。如果经过检验发现数据并不满足正态性特征,这个时候可以先进行数据的非正态转化,但是转化并不能保证数据一定能满足正态性特征。同时需要注意,有实际意义的数据经过转化后可能失去实际意义。原创 2023-02-27 11:06:21 · 2087 阅读 · 0 评论 -
聚合效度全流程
聚合效度(convergent validity),又称收敛效度,是指测量同一变量的测量项会落在同一因子上,强调本应该在同一因子下的测量项,确实在同一因子下。即一个变量的测量题项之间要高度相关。从题项角度讲,聚合效度是维度内所有题项相关性要高。进行聚合效度分析的主要目的在于检验同一变量的各指标之间的相关程度。聚合效度分析一般只针对量表题进行,可以使用SPSSAU中验证性因子分析进行。聚合效度用于分析本应该在同一因子下的测量项,确实在同一因子下面。原创 2023-02-27 11:02:08 · 2241 阅读 · 0 评论 -
区分效度全流程分析
简单来讲,在研究者设计量表之初,一般会预设好几个维度,在经过因子分析后,需要验证测量的数据是否与预设的几个维度相对应,如果测量项与预设维度之间对应关系良好,则说明量表的结构效度良好,说明量表设计的合理且有效,那么通过该量表得到的分析结果也是有效的。所以研究者可以根据实际情况,关注一些常用指标,包括卡方自由度比,GFI,RMSEA,RMR,CFI,NFI和NNFI。从上表可以看出,对比分析以上7个指标,M0模型都是最接近判断标准的,即将因子分为A,B,C,D 4个的模型是最优的模型。原创 2023-02-24 19:01:52 · 3091 阅读 · 0 评论 -
正交实验与极差分析
进行正交试验分析,首先需要进行正交表的设计, SPSSAU默认找到最接近的标准正交表,如果与试验预期不符,可以进行正交表的改造后再使用。然后根据得到的正交表进行试验,记录好试验结果,上传到SPSSAU系统。最后使用极差分析(或方差分析)来分析正交试验结果,得到最优因素和最佳因素水平组合。原创 2023-02-24 18:48:12 · 4082 阅读 · 0 评论 -
因子分析计算权重
因子权重计算与指标权重计算都可以通过SPSSAU因子分析输出的结果进行计算。因子权重使用旋转后方差解释率以及旋转后累计方差解释率进行计算;指标项权重使用归一化综合得分系数进行计算。虽然指标项计算过程略显复杂,但SPSSAU会在线性组合系数及权重结果这张表中自动输出权重值,大大简化了手动计算的繁琐步骤。如果使用了因子分析计算因子权重后,不想再使用因子分析计算指标项权重,那么可以使用其他权重计算方法进行指标项权重的计算。原创 2023-02-24 18:47:21 · 6374 阅读 · 0 评论 -
倾向得分匹配只看这篇就够了
倾向得分匹配法是通过对样本建模(logit模型)得到Pscore值,通过Pscore值为处理组在控制组中找到最接近的样本,从而进行研究的。PSM的优点在于可以控制干扰因素的影响、提高研究的证明力度;但其缺点也不可忽视,例如PSM需要样本量大、可能并非所有样本都能匹配成功,所以导致匹配后引起的样本量的损失问题不能忽视,甚至无法确定匹配后的样本是否能代表原有研究样本。原创 2023-02-24 18:40:03 · 19939 阅读 · 1 评论 -
结构效度分析流程
结构效度分析是为了检验测量项与预期维度对应关系情况。效度分析没有固定的判断标准,是综合各项指标进行的一个综合判断过程,包括KMO值、Bartlett球形度检验、因子载荷系数、共同度、维度与测量项对应关系等。其中最重要的是查看维度与测量项的对应关系,最难的部分也在于维度与测量项对应关系的调整,其他指标比较容易达标。当效度分析不达标时,可以按照第三部分所讲的内容,查看自己的问题所在,进行对应的修改。一定要注意,效度分析并不是一步完成的,可能是一个需要反复调整才能得到最优结果的过程。原创 2023-02-24 18:35:16 · 7451 阅读 · 0 评论 -
验证性因子分析(CFA)全流程
本篇案例想要研究“实际数据是否符合理论模型假设的结构”,利用验证性因子分析进行说明,由于是问卷数据,所以进行信度分析和探索性因子分析,分析数据的信度、效度以及变量与测量项之间的关系,发现数据良好,接着对数据进行验证性因子分析,发现数据拟合不是很好,对模型进行修正,建立协方差关系,经过反复修正,最后得到更好的模型,然后对模型进行评价。分析结束。更多信息请登录SPSSAU官网平台进行查看。原创 2023-02-24 17:59:47 · 16237 阅读 · 0 评论 -
结构方程模型全流程
本篇案例通过结构方程模型对教师懈怠感的课题进行研究,首先对模型进行构建,然后对构建的模型进行评价,发现“工作超负荷”对情感枯竭有正向影响关系,情感枯竭对自我丧失感也产生正影响关系,但是情感枯竭对个人成就感产生负向影响关系。通过模型拟合指标发现卡方自由度比不达标,所以利用MI指标调整法进行调整,经过三次调整建立了三个协方差关系,最后模型拟合指标达标,模型拟合良好,结构方程模型的应用不仅能辨析作用路径,还为理清模型真正的作用机制提供了帮助。更多信息请参考SPSSAU官方平台。原创 2023-02-24 17:56:24 · 4463 阅读 · 1 评论 -
双因素方差分析全流程
通过双因素方差分析研究了“品牌和地区对吸尘器的销售量是否有显著差异以及两个因素搭配是否对销售量产生新的影响”,最后发现品牌和地区对吸尘器的销售量有显著性差异,但是两个因素搭配并未对对销售量产生新的影响,并且利用事后多重比较进一步分析发现不同地区对销售量有显著性差异,并且地区2销量更好,不同品牌两两之间的销量均有显著性差异品牌1的销量更好,所以公司在做决策时可以重点分析地区2和品牌1的特点或者策略等。原创 2023-02-21 15:49:57 · 1145 阅读 · 0 评论 -
双因素方差分析
利用线性回归对管理者的问题进行分析,首先对数据的进本关系进行查看以及探索数据是否满足线性回归分析的条件,对数据处理后进行线性回归分析,发现“本年累积应收贷款”、 “贷款项目个数”对“不良贷款”有影响,并且查看标准化系数发现“本年累积应收贷款”影响程度更大,这对于管理者后续分析提供了有效信息。分析完毕。原创 2023-02-21 15:25:23 · 1567 阅读 · 0 评论 -
Moran指数分析
Moran指数(莫兰指数)是研究空间关系的一种相关系数值,比如研究中国31省市GDP之间是否具有空间相关关系。Moran指数通常分为两种,分别是全局Moran指数和local局部Moran指数。全局Moran指数用于分析整体上是否存在空间相关关系,如果全局Moran指数呈现出显著性,接着可进一步深入分析局部Moran指数了解细节性关系情况等。Moran指数的计算上需要提供两项数据,分别是分析项数据,比如中国2021年GDP数据。原创 2022-12-29 14:20:17 · 3759 阅读 · 0 评论 -
论文指标评价体系及权重计算
上述三种方法中,熵值法计算准则层权重这种方法使用较少,原因很可能在于因素层计算权重时,也是利用熵值法进行计算,准则层和因素层都在利用完全相同的数据,并且基于权重计算原理均是熵信息,因而使用较少,从分析角度可以如此进行。统设定主成分个数为5个(准则层指标为5个),并且从主成分结果上确保准则层指标与因素层指标之间有着良好对应关系后,最后利用 “ 方差解释率 ”进行权重计算,得到准则层指标权重。计算因素层指标权重较多,该论文中共有5个准则层指标,因而分别进行5次分析,分别计算出因素层的所有指标权重值。原创 2022-11-29 15:28:35 · 3832 阅读 · 0 评论 -
结构方程模型调整
模型拆分法是指将复杂的结构方程模型进行分拆,分拆成多个小的结构方程模型,此处理可将模型简化,从而更容易让模型达标,通常情况下越为复杂的模型其要求越高,越简单的模型越易达标。MI修正指标表示固定或约束参数时,其可为模型带来的预期卡方减少量,因而从原理上该修正可对卡方自由度这个重要的评价指标带来帮助,理论上对其它指标的帮助通常不会太大,但从经验角度上看,结合MI指标进行模型修正后,通常各项指标均有一定改善,只是相对来看,卡方自由度指标的减少较为明显。上述中的四大原因时,不正确使用和数据质量差不在考虑范畴。原创 2022-11-29 14:57:07 · 2583 阅读 · 0 评论 -
面板模型进行熵值法分析
如果进行量纲化处理,比如归一化处理,其意味着将数据全部压缩在0~1之间,此时所有指标的数据量纲完全一致,即每个指标数据的信息熵的度量范围也完全一致。熵值法(熵权法)是一种研究指标权重的研究方法,比如有5个指标,分别为指标1到指标5,并且有很多样本(比如100个样本),即100行*5列数据,此时研究该5个指标的权重分别是多少。比如上表格,分别做5次分析,每次均得到5个指标的权重,然后整理后,再对某个指标下的几个权重,比如表格中第2列5个数字求平均得到41.34%,即为最终指标1权重。原创 2022-11-29 14:53:36 · 2069 阅读 · 0 评论 -
马尔可夫预测案例分析
根据已经有数据进行预测的研究方法有很多,包括arima模型、指数平滑法、灰色预测等,本文针对马尔可夫预测进行阐述。比如研究中国移动,中国联通和中国电信三家运营商,他们的用户可以互相携号转网,已经当前3家运营商的市场份额,而且也能测试出用户转网的可能性,那么将来3家运营商的市场份额情况如何,即利用当前已知的两项数据,分别是当前的市场份额、用户接下来使用运营商的可能性(即转移概率矩阵),则可预测将来3家运营商的市场份额情况。上述中提及‘3家运营商’,马尔可夫预测模型中称其为‘3种状态’。原创 2022-11-29 13:49:09 · 3176 阅读 · 1 评论 -
使用SPSSAU进行Roc联合诊断
思想上,如何将‘4个指标’合并成一个,通常是使用二元logit回归,将4个指标作为X,将‘低出生体重儿’作为Y进行二元logit回归,并且得到‘预测值’,该‘预测值’即为4个指标的整体汇总指标值,然后将该’预测值‘作为检验变量X,然后将’低出生体重儿’作为状态变量Y进行分析即可。但是该4项指标合计在一起的时候,联合诊断效果如何,是否可以使用一个整体汇总指标来标识出‘4个指标’。比如‘低出生体重儿’的出生,受到产妇年龄,产妇体重,产妇在妊娠期间是否吸烟,是否患有高血压共4项指标的影响。2、SPSSAU操作。原创 2022-11-29 11:55:25 · 775 阅读 · 0 评论 -
交互作用的深入剖析
比如A因素为性别,B因素为区域,男性并且北方群体时身高如何,男性并且南方群体时身高如何,也或者女性并且北方群体时身高如何,女性并且南方群体时身高如何。接着后续进行分析时,切记,有5个哑变量(或5个交互项),以及通常使用ols线性回归进行交互作用分析,那么一定要少放1项(即参照项),至于是少放‘专科以下’,也或者‘博士’,由研究者决定,少放的该项即为参照项。哑变量乘积法时,将A因素进行哑变量处理,然后将得到的哑变量分别与B因素相乘,即得到交互项,至于后续分析方法,通常是使用ols线性回归。原创 2022-11-28 17:59:13 · 3956 阅读 · 0 评论 -
多重共线性如何分析?
从上式可以看出,VIF若大于10其R方相对应也大于0.9,若VIF大于5其R方相对于大于0.8,如果存在这种现象,可以认为该自变量是其他自变量的近似线性组合,也就是说,在自变量之间存在高度相关的现象。岭回归分析是一种修正的最小二乘估计法,当自变量系统中存在多重共线性时,它可以提供一个有偏估计量,这个估计量虽有微小偏差,但它的精度却能大大高于无偏估计。构造一个新的变量,这一新变量是多重共线性变量的函数,然后用这个新的变量代替多重共线性的变量,但是要注意组合后的数据需要有实际意义否则模型不好解释。原创 2022-11-28 17:48:21 · 3145 阅读 · 0 评论 -
Hosmer-Lemeshow检验(HL检验)
由表格中的回归系数可以看出,X2的回归系数为0.038,X3的回归系数为0.076,X4的回归系数为0.012,截距的回归系数为-9.897,所以模型公式为:ln(p/1-p)=-9.897 + 0.038*X2 + 0.076*X3 + 0.012*X4(其中p代表Y为1 的概率,1-p代表Y为0的概率)。通过在基于 F 检验的现有模型中添加或删除预测变量,执行变量选择。对于H-L检验,一般p值大于0.05,说明模型拟合良好,p原创 2022-11-28 17:43:44 · 10927 阅读 · 0 评论 -
结构方程模型如何分析?
结构方程模型是被广泛认可的研究可观测变量与潜在变量,以及潜在变量之间关系的重要工具。结构方程模型包括两个基本模型,分别为测量模型和结构模型,测量模型由潜在变量、观测变量以及测量误差项组成,主要分析潜在变量与观测变量的共变效果。路径分析在于研究模型影响关系,用于对模型假设进行验证。比如下图的模型框架:希望研究工作条件,人际关系对于公司满意度的影响;同时还希望研究公司满意度和机会感知对于离职倾向的影响。路径有一共有4条(即4对影响关系),路径分析可以同时研究此4对影响关系。原创 2022-11-28 16:58:46 · 1631 阅读 · 0 评论 -
问卷调查的数据如何分析?
一般在正式分析前,研究者常常需要构建模型框架,基于模型框架进行分析研究,例如数据分析、原理研究等等。那么如何构建基础的模型框架,以下以‘笔记本电脑购买意愿影响因素’来进行举例说明。模型框架直观展示出‘笔记本电脑购买意愿影响因素’的对应关系,由模型可以看出研究的影响因素共包含四大类,其中包括‘产品’、‘价格’、‘性能’以及‘售后服务’,被影响的因素也就是因变量Y是购买意愿。模型框架在分析一开始就要理清思路,基于模型框架之后才有后面对应的数据搜集,数据分析等。原创 2022-11-28 16:54:18 · 10569 阅读 · 0 评论 -
如何做方差分析?
本篇案例利用单因素方差分析进行研究4种饲料对猪体重增加的作用有无不同,首先对数据进行预判断,判断数据是否满足正态性,方差齐性,以及对数据分布趋势进行简单查看,发现数据满足方差分析前提,接着对方差结果进行说明,其中包括4个方面,分析后发现4种饲料对猪体重增加的作用存在不同。分析结束。更多干货请登录SPSSAU官网进行查看。原创 2022-10-28 10:34:46 · 2436 阅读 · 0 评论 -
如何处理多重共线性问题
通过对数据进行简单查看,发现数据具有多重共线性所以对数据进行处理,处理的方式选择岭回归,对岭回归分模型效果和模型结果两个方面进行阐述,最后得到公式为:不良贷款(亿元)=-0.159 + 0.012*各项贷款余额(亿元) + 0.126*本年累积应收贷款(亿元) + 0.066*贷款项目个数 + 0.004*本年固定资产投资额(亿元)。各项贷款余额、本年累积应收贷款、贷款项目个数三个自变量p值均小于0.05,具有显著性差异,而本年固定资产投资额p值为0.418大于0.05,不具有统计学意义。原创 2022-10-28 10:32:51 · 9641 阅读 · 0 评论 -
多分类logit回归案例分析
案例利用多分类logit回归分析方法,以“幸福感”为因变量,“婚姻状况”和“年份”为自变量建立模型,观察模型影响因素。在分析前对自变量进行处理以及对结果进行分析,其中包括基本汇总、模型似然比检验、模型公式及影响关系以及模型预测效果分析,该案例分析模型预测不是重点,如正常分析可以忽略。最后发现就是相对于“幸福感”来讲,未婚成年人比已婚成年人会幸福。1985年调查成年人比1995年调查的成年人更幸福。更多干货请登录SPSSAU官网进行查看。原创 2023-03-29 10:08:17 · 1591 阅读 · 0 评论 -
多选题分析汇总
最后分析选择不同选项是否有差异。13个样本中9个样本选择‘选项2’普及率为61.54%,是样本量选择最多的选项,其次是‘选项4’普及率为61.54%,然后是‘选项1’普及率占比是53.83%,最后是‘选项3’普及率为38.46%也是是样本量选择最少的选项。从图中可以看出‘B’和‘低’两个点挨在一起,‘D’和‘中’两个点挨在一起,‘A’、‘C’、‘F’和‘高’几个点挨着一起,所以可以说明低收入的人更偏好‘B’品牌的电脑,中收入的人更喜欢‘D’品牌电脑,高收入人群更偏好‘A’、‘C’和‘F’三种品牌的电脑。原创 2022-10-28 10:29:01 · 2334 阅读 · 0 评论 -
量纲化处理汇总
但是量纲化有很多种方式,但具体应该使用哪一种方式,并没有固定的标准,而应该结合数据情况或者研究算法,选择最适合的量纲化处理方式,SPSSAU共提供12种量纲化处理方法,下面进行说明。量纲化有很多种处理方式,其中常见的处理为12种,SPSSAU均有提供,可以将12种方法分为两大类,一类为‘有实际意义的量纲处理’另一类为‘数理化的量纲处理’。使用‘有实际意义的量纲处理’即均值化,初值化,最小值化,最大值化,求和归一化,平方和归一化。在实际研究中有的指标是越小越好,此时为逆向指标,需要对逆向指标正向且量纲化。原创 2022-10-28 10:26:50 · 1058 阅读 · 0 评论 -
关于信度分析的多种方法
以SPSSAU为例,信度分析的位置在【问卷研究】→【信度】图 1:信度分析位置。原创 2022-10-28 10:24:26 · 3066 阅读 · 0 评论 -
关于信度分析的多种方法
以SPSSAU为例,信度分析的位置在【问卷研究】→【信度】图 1:信度分析位置。原创 2022-10-28 10:25:15 · 3717 阅读 · 0 评论 -
写论文时,不知道如何检验正态分布?
直方图若呈现‘中间高,两边低,左右基本对称的钟形图’则基本服从正态分析,但是数据量过少等也可能影响结果导致很难呈现出标准的正态分布,如果是这种情况如果看见‘钟形’也可以可以接受的。针对上述几种方法,正态性检验最为严谨,但是实际数据由于样本量较少等原因,即使数据总体正态但统计检验出来也显示非正态,实用性没有图示法直观且接受性没有图示法高,所以在分析中常常图示法应用的比较多,如果在分析中数据严重不正态应该怎么办呢?Jarque-Bera检验中,p值小于0.05,所以模型显著,拒绝原假设,数据不服从正态分布。原创 2022-10-28 10:22:38 · 2083 阅读 · 0 评论 -
毕业论文使用的卡方检验该如何分析?
有时,在研究中某个随机变量是否服从某种特定的分布是需要进行检验的。可以根据以往的经验或者实际的观测数据分布情况,推测总体可能服从某种分布函数F(x)。卡方检验就是这样一种用来检验给定的概率值下数据来自同一总体的无效假设方法。通常的卡方检验可以用来研究分析定类数据与定类数据之间的关系情况。在卡方检验中,通常检验的统计量 χ2 如下:其中A代表某个类别的观察频数,E代表基于H0计算出的期望频数,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。原创 2022-10-28 10:20:23 · 5314 阅读 · 0 评论 -
毕业论文中的问卷如何做效度分析?
效度分析用于分析题是否可以有效的表达对应变量的概念信息,即分析量表题设计是否合理。在预测试和正式研究时均可以进行效度的分析,在绝大多数情况下,问卷研究会使用探索性因子分析进行结构效度分析,如果量表具有很强的权威性,那么不需要使用探索性因子分析进行结构效度分析,使用内容效度分析即可。那么效度包含哪些方法,应该怎么分析?接下来进行描述。效度类别可以分为四大类,其中包括内容效度、结构效度、区分效度以及收敛效度。原创 2022-10-28 10:17:41 · 5257 阅读 · 0 评论 -
毕业论文中的数据分析无从下手?
最近有很多小伙伴已经开始准备毕业论文了,但是对于论文中数据如何进行分析,选择什么方法,怎样对结果说明无从下手,接下来小编将从模型框架的构建、模型框架的分析等方面进行说明。SPSSAU一般在正式分析前,研究者常常需要构建模型框架,基于模型框架进行分析研究,例如数据分析、原理研究等等。那么如何构建基础的模型框架,以下以‘笔记本电脑购买意愿影响因素’来进行举例说明。原创 2022-10-28 10:12:54 · 1642 阅读 · 0 评论 -
双因素方差分析全流程汇总
就是通过检验各总体的是否相等来判断分类型自变量(定类变量)对数据型因变量(定量变量)是否有显著影响。方差分析一般分为单因素方差分析、双因素方差分析、三因素方差分析以及多因素方差分析。利用针对双因素方差分析举例说明:背景简单说明:研究性别和学历对产品的满意度是否有显著影响。原创 2022-10-27 18:59:17 · 1577 阅读 · 0 评论 -
二项logistic回归案例分附操作析(数据)
现收集到银行贷款客户的个人、负债信息,以及曾经是否有过还贷违约的记录,试分析是否违约的相关因素,并构建模型用于贷款违约风险预测。(数据来源:SPSS自带案例数据集)数据上传SPSSAU后,在 “我的数据”中查看浏览原始数据,前5行数据如下:图1 “我的数据”查看浏览数据集。原创 2022-09-28 10:24:33 · 3578 阅读 · 1 评论 -
考察交互的方差分析与简单效应分析(附带操作数据)
治疗缺铁性贫血病人12例,分4组给予基础疗法和甲乙两种药物治疗,一个月后观察红细胞增加数(百万/mm),试分析甲乙用药对治疗效果的影响。数据上传SPSSAU后,在 “我的数据”中查看浏览原始数据,部分数据如下:图1 “我的数据”查看浏览数据集。原创 2022-09-28 10:20:18 · 2671 阅读 · 0 评论 -
二项logistic回归案例分析(附操作数据)
现收集到银行贷款客户的个人、负债信息,以及曾经是否有过还贷违约的记录,试分析是否违约的相关因素,并构建模型用于贷款违约风险预测。(数据来源:SPSS自带案例数据集)数据上传SPSSAU后,在 “我的数据”中查看浏览原始数据,前5行数据如下:图1 “我的数据”查看浏览数据集。原创 2022-09-27 15:34:01 · 7109 阅读 · 0 评论 -
协整检验该如何分析?
在宏观计量经济研究中,通常会使用VAR模型研究多个时间经济变量之间的数量关系情况,但是VAR模型要求数据无单位根或者同阶单整,如果无单位根通常可直接进行VAR模型构建,如果有单位根但是满足同阶单整,此时则可使用协整检验进行分析模型稳定性,通常协整关系后再建立VAR模型即可。与此同时,协整关系也是建立比如误差修正模型(SPSSAU中的ECM模型)的前提条件。如果研究变量存在协整关系则说明研究数据具有长期均衡关系。原创 2022-09-27 15:34:39 · 14322 阅读 · 0 评论