前言
#记得开心
#本期内容:线性回归的衍生模型
#由于导师最近布置了学习SPSS这款软件的任务,因此想来平台和大家一起交流下学习经验,这期推送内容接上一次高级教程第六章的学习笔记,希望能得到一些指正和帮助~
粉丝及官方意见说明
#针对官方爸爸的意见说的推送缺乏操作过程的数据案例文件澄清如下:1、操作演示的数据全部由我本人随意假设输进去的,重在演示操作;2、本人也只是在学习阶段,希望友友们能谅解哈,手里有数据的宝子当然更好啦,没有咱就自己假设数据练习一下也没多大关系的哈;3、我也会在后续教程中尽量增加一些数据的必要性说明;4、大家有什么好的意见也可以在评论区一起交流吖~
第七章一些学习笔记
- SPSS中当数据没有很好的满足多重线性回归的适用条件时,此时应采用线性回归的衍生模型来处理数据(常常可以采用曲线直线化【非直线趋势的处理】、加权最小二乘法【方差不齐的处理】、岭回归【共线性的处理,由于岭回归是有偏估计,为了尽量保留信息,k值不宜取的太大】、最优尺度回归【分类变量数值化,专门用于解决统计建模时如何对分类变量进行量化的问题,其注意事项有样本量较大、变换结果与模型有关、对有序分类变量的处理、最佳的预分析手段】、稳健回归与分位数回归【用于强影响点弱化】)。--统计分析高级教程(第三版)P129-146
- SPSS中通常而言,最小一乘法、稳健回归和分位数回归、最小二乘法三种模型很难判断那个最优,一般需要通过专业知识来选择。--统计分析高级教程(第三版)P148
第七章一些操作方法
线性回归的衍生模型
曲线估算过程
保存(这里可以按需求保存一些变量数据)
加权最小二乘法WLS过程
(需要注意的是,加权最小二乘法WLS是一种有偏估计,若变异程度实际上无波动,或者选择了错误的变量预测变异程度,则拟合效果不如普通最小二乘法OLS准确)
这里虽然可以更改指数范围,但可拟合的方程总数应在150个以内。
共线性的处理:岭回归
这里由于没有直接的功能,则需要调用SPSS中的一个宏程序来实现
可以看出当k取值为0.4时候,趋于稳定【第一个图岭迹ridge trace在0.4附近时,三条岭迹都变得平稳;第二个图决定系数在0.4之后,下降一直没有出现波动】
分类变量的数值化:最有尺度回归
下面对变换后的数据进行保存并绘图考察
基于M估计的稳健回归(robust regression)【该功能在R插件中,一般正常界面没有】
研究表明当误差服从正态分布时,其效果比OLS稍差一些,当存在强影响点时,误差为非正态分布时,其拟合效果要比OLS好得多。
分位数回归
断点回归【也要通过R插件实现,常用来控制变量来消除变量以外的影响】
Tobit回归【也要通过R插件实现,解决因变量取值明显受限,甚至为离散数值时,存在极值时的建模问题,当出现删失数据时,最常用】
结束语
#好啦~,以上就是我SPSS第二十五期学习笔记——高级教程第七章的学习情况啦~,希望能与大家交流学习经验,共同进步吖~
#考虑高级教程的难度与深度,主要是内容太多辣,后续依然会尽力更新内容~争取日更!
#也非常感谢大家对我的一路陪伴,宝子们的关注、支持和打赏就是up儿不断更新滴动力,我近期也会坚持学习SPSS,更新相应的学习内容及笔记到平台上,咱们下期高级教程不见不散~