线性回归是一种研究影响关系的方法,在实际研究里非常常见。本文就来梳理下线性回归分析的分析流程,闲话少说,我们开始吧!
线性回归
回归分析实质上就是研究一个或多个自变量X对一个因变量Y(定量数据)的影响关系情况。
当自变量为1个时,是一元线性回归,又称作简单线性回归;自变量为2个及以上时,称为多元线性回归。在SPSSAU里均是使用【通用方法】里的【线性回归】实现分析的。
SPSSAU-线性回归
Step1:数据类型
线性回归要求因变量Y(被解释变量)一定是定量数据,如果因变量Y为定类数据,则可以采用【进阶方法】中的【logit回归】。
Step2:变量筛选
对于引入模型的自变量,通常没有个数要求。但从经验上看,不要一次性放入太多自变量。如果同时自变量太多,容易引起共线性问题。建议根据专业知识进行选择,同时样本量不能过少,通常要满足样本个数是自变量的20倍以上。
如果自变量为定类数据,需要对变量进行哑变量处理。可以在SPSSAU的【数据处理】→【生成变量】进行设置。具体步骤可以查看:什么是虚拟变量?怎么设置才正确?
控制变量,可以是定量数据,也可以是定类数据。一般来说更多是定类数据,如:性别,年龄,工作年限等人口统计学变量。通常情况下,不需要处理,可以直接和自变量一起放入X分