逐步回归是回归分析中使用的一种方法,用于确定要包含在模型中的最重要的预测变量。 该过程涉及根据变量的统计显着性向模型添加或删除变量,通常由 p 值或其他一些统计标准确定。
逐步回归模型的方程式取决于最终模型中包含的特定预测变量。 通常,线性回归方程具有以下形式:
y = β0 + β1x1 + β2x2 + … + βkxk
其中 y 是因变量,x1, x2, …, xk 是自变量,β0 是截距,β1, β2, …, βk 是表示自变量与变量之间关系的回归系数 因变量。
在逐步回归模型中,根据逐步选择过程的结果,只有一部分自变量会包含在最终方程中。 因此,方程式将具有以下形式:
y = β0 + β1x1 + β2x2 + … + βm xm
其中 x1, x2, …, xm 是被选择包含在模型中的自变量,β1, β2, …, βm 是相应的回归系数。
逐步回归是一个个进,可以的就留下来,不可以的就剔除。当自变量的个数太多的时候,自变量之前的混杂干扰会非常严重,从而直接影响回归模型运算结果的准确性。当回归模型的自变量多于8个时候,建议时候线性回归分析。(多元回归适用于变量较少的情况)