线性回归分析基本内容
回归分析 是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决。
回归分析的任务就是:
通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。
线性回归有3个关键词:相关性、Y、X
- 相关性≠因果性
- Y为因变量
- X为自变量
回归分析的使命:
1、识别重要变量
识别并判断,哪些X变量是同Y相关的,哪些变量不相关。去除了那些于Y无关的自变量X,那么剩下的,就都是重要的、有用的X变量了。
2、判断相关性的方向
这些有用的变量同Y的相关是正的,还是负的呢?
3、估计权重(回归系数)
在确定了重要自变量X后,我们还需要给X赋予一定的地位(权重,也就是不同的回归系数),进而我们可以知道这些重要变量X中,不同变量之间的相对重要程度。
利用SPSS软件进行一元线性回归
Step1:导入数据
本例采用的是模拟数据,将Excel中的数据导入到SPSS中。