前言
#天地不限人,则天地无限
#由于导师最近布置了学习SPSS这款软件的任务,因此想来平台和大家一起交流下学习经验,这期推送内容接上一次高级教程第三章的学习笔记,希望能得到一些指正和帮助~
粉丝及官方意见说明
#针对官方爸爸的意见说的推送缺乏操作过程的数据案例文件澄清如下:1、操作演示的数据全部由我本人随意假设输进去的,重在演示操作;2、本人也只是在学习阶段,希望友友们能谅解哈,手里有数据的宝子当然更好啦,没有咱就自己假设数据练习一下也没多大关系的哈;3、我也会在后续教程中尽量增加一些数据的必要性说明;4、大家有什么好的意见也可以在评论区一起交流吖~
第四章一些学习笔记
- SPSS中考虑时间顺序的重复测量数据,又称纵向数据(longitudinal data),在分析时除了需要考虑数据非独立性的影响外,往往还希望知道各次重复测量间的相关关系是怎样的。--统计分析高级教程(第三版)P75
- SPSS中对于重复测量次数少且设计均衡的情况,一般可以使用非确定相关【需要估计6个相关系数】或等相关结构【需要估计1个相关系数】,因此当样本量较少且模型的分析重点不在相关矩阵上时,可以考虑使用等相关结构以简化分析;若时间间隔不等,可以采用稳态相关、自相关等相关形式,或者把相关拟合成时间的函数;若案例值的聚集性无严格先后顺序,则常采用等相关。--统计分析高级教程(第三版)P82
- SPSS中可用相关矩阵种类包括:1、独立,即不相关【标度恒等(scaled identity,有假定测量方差相同)、对角(diagonal)】;2、等相关【复合对称(compound symmetry,假定两个时间点案例值间的相关系数是相等的,又称为可交换的(exchangeable)),常用于时间间隔不太长的纵向观察数据,或同时间点的重复测量数据的分析】;3、平稳相关【特普利茨(Toeplitz),即间隔时间相同的两次测量相关系数相同】;4、自相关【间隔次数越长相关系数越小,也称为一阶自相关(first order auto-correlation),一般用于不同时间点的纵向数据的分析】;5、非确定相关【非结构化(unstructured),一般不用于最终模型,常用来判定是否内部相关以及相关结构】。--统计分析高级教程(第三版)P83
- SPSS中线性混合模型的用途:1、对固定效应参数进行更准确的估计;2、对变异的影响因素加以研究;3、对重复测量数据的分析及规律探讨。线性混合模型与一般线性模型的联系:1、单因素方差分析模型【等价于只有一个固定因子时线性混合模型】;2、方差分析模型【等价于随机效应被设定为标度恒等时无重复测量模型】;3、线性回归模型【等价于方差分析模型,等价于只含有协变量、无因素时线性混合模型的分析结果】;4、方差成分模型【等价于无重复测量,而且所有随机效应被限定为标度恒等时的混合效应模型】。--统计分析高级教程(第三版)P83-84
第四章一些操作方法
线性混合模型
主要针对处理非独立数据,有数据聚集性的数据,相应解决方法主要包括混合效应模型(同时含有随机因子和固定因子的模型)【又称为多水平模型(multilevel models)、广义估计方程(GEEs)等】,这些模型还可以对变异的影响因素进行分析。
因为混合效应模型比较复杂,任何“轻微”的扰动都可能让模型变得面目全非,因此在拟合之前对相应变量进行标准正态变换,若只是进行简单的模型拟合且只考虑对固定效应的参数进行估计,则不进行变换影响也不大。
层次聚集性数据分析
先用上一章节方法对数据进行不考虑交互作用的分析(这里P值小于0.05就有意义)
下面进行拟合基本的模型结构
结果解释
这里随机部分使用的是Wald检验,给出的近似结果,当P值接近0.05时,才需要使用对数似然值进行似然比检验【第十章Logistic会有教程】以做出更精确的判断。
上述图片中的有无差异表示有无聚集性
下面在固定效应中加入自变量(考虑模型复杂性,一般需要手动设定)
信息准则越小,模型就能够解释更多的数据中的变异,下面进行结果解释
在随机效应中加入自变量(同时分析该变量对模型的离散程度有无影响)
结果解释
信息准则有所减少,说明变量纳入随机效应是合理的,的确使模型能够解释更多的数据变异
更多自变量的引入操作方法与前面相似(这里模型无法拟合是数据的问题,与操作方法无关)
若数据合理,会发现信息准则值会进一步下降,模型会有所改善
若后续检验有变量有统计学意义,则需要用似然比检验来得到更精确的P值,再做判断
其他常用选项
重复测量数据案例(因变量:距离;每一个个体不同时间测量了4次;影响因素有:年龄、性别、个体;已知个体差异存在【画线图得知】)
下面进行相应的方差分解
下面进行拟合基本模型结构
预分析(按照混合效应模型的方式对数据进行建模,GLM过程结果相同)
下面进行拟合基本模型
考虑测量间的相关性,重新拟合模型(这里的第五步非结构化,我选择的其实不对,后面有专门的“非结构化”和“非结构化:考虑相关性”,试了以下又是由于我随意假设的数据问题导致无法出结果,操作是没问题的)
这里的信息准则值与上次是一样的,也说明模型没有改善
经验上说,样本数据信息更支持不加任何限定的模型
也就是说,由于我数据假设的不到位(数据量太小了,也是为了节约时间),导致考虑相关和不考虑相关两次分析结果是一样的。
更改对测量间相关性的假定(若为等相关,改为“复合对称(compound symmetry)”)
结束语
#好啦~,以上就是我SPSS第二十二期学习笔记——高级教程第四章的学习情况啦~,希望能与大家交流学习经验,共同进步吖~
#考虑高级教程的难度与深度,主要是内容太多辣,后续依然会尽力更新内容~争取两天一更
#也非常感谢大家对我的一路陪伴,宝子们的关注、支持和打赏就是up儿不断更新滴动力,我近期也会坚持学习SPSS,更新相应的学习内容及笔记到平台上,咱们下期高级教程不见不散~