逐步回归三种策略
1.前向选择从模型中没有预测变量开始,迭代地添加最多的贡献预测变量,并在改进不再具有统计显着性时停止。
2.向后选择(或向后消除),从模型中的所有预测变量(完整模型)开始,迭代地移除最少的贡献预测变量,并在您拥有所有预测变量具有统计显着性的模型时停止。
3.逐步选择(或顺序替换),这是前向和后向选择的组合。从没有预测变量开始,然后依次添加最有贡献的预测变量(如前向选择)。添加每个新变量后,删除任何不再提供模型拟合改进的变量(如向后选择)。
前向选择和逐步选择可以应用于高维配置,其中样本数n不如预测变量p的数量,例如在基因组数据中。
向后选择要求样本数n大于变量数p,以便可以拟合整个模型。