原文链接:多元线性逐步回归https://mp.weixin.qq.com/s/0Ll0QUHaQFm0OrtPWAJ63A
实际问题中,影响因变量Y的因素有很多,人们需要挑选若干变量来建立回归方程,但是要如何选择变量呢?有时我们会漏掉重要的自变量,那么所建立的方程意义就不大;有时又想囊括更多的自变量,此举会导致预测精度的下降,这是由于SSE自由度的减少会导致其δ2的估计增大[1]。要建立“最优”的回归方程,我们需要从可供选择的所有变量中挑选出对Y有显著影响的变量,并且剔除其它无显著影响的变量。
“逐步回归法”是较为常用的一种方法。它有三种实现策略:正向选择、后向选择和逐步选择。一般所说的逐步回归指的是最后一种,它结合了前两种方式的优点。它首先正向引入一个自变量,然后对原有自变量进行检验,根据结果剔除不显著的自变量,如此反复进行自变量的引入和剔除操作。
逐步回归法除了剔除不太重要的变量,还会剔除和其它变量高度相关的变量,以降低多重共线性程度[2]。逐个引入