线性回归分析是一种研究影响关系的方法,在实际研究里非常常见。不管你有没有系统学习过,对于线性回归,相信多少都有那么一点了解。
即使如此,在实际分析时,还是会碰到很多小细节,让我们苦思冥想困扰很久,又影响效率。因此本文就一起梳理下回归分析的分析流程,闲话少说,我们开始吧。
线性回归
回归分析实质上就是研究一个或多个自变量X对一个因变量Y(定量数据)的影响关系情况。
当自变量为1个时,是一元线性回归,又称作简单线性回归;自变量为2个及以上时,称为多元线性回归。在SPSSAU里均可以使用【通用方法】→【线性回归】实现。
1. 数据类型
线性回归要求因变量Y(被解释变量)一定是定量数据。如果因变量Y为定类数据,可以用【进阶方法】中的【logit回归】。
2. 变量筛选
对于引入模型的自变量,通常没有个数要求。但从经验上看,不要一次性放入太多自变量。如果同时自变量太多,容易引起共线性问题。建议根据专业知识进行选择,同时样本量不能过少,通常要满足样本个数是自变量的20倍以上。
如果自变量为定类数据,需要对变量进行哑变量处理,可以在SPSSAU的【数据处理】→【生成变量】进行设置。具体设置步骤查看SPSSAU有关哑变量的文章:什么是虚拟变量?怎么设置才正确?
控制变量,可以是定量数据,也可以是定类数据