§4 逐步回归分析

1、逐步回归分析的主要思路

  在实际问题中, 人们总是希望从对因变量多元回归分析原理(4) - cake - Cake的个人主页有影响的诸多变量中选择一些变量作为自变量, 应用多元回归分析的方法建立“最优”回归方程以便对因变量进行预报或控制。所谓“最优”回归方程, 主要是指希望在回归方程中包含所有对因变量多元回归分析原理(4) - cake - Cake的个人主页影响显著的自变量而不包含对多元回归分析原理(4) - cake - Cake的个人主页影响不显著的自变量的回归方程。逐步回归分析正是根据这种原则提出来的一种回归分析方法。它的主要思路是在考虑的全部自变量中按其对多元回归分析原理(4) - cake - Cake的个人主页的作用大小, 显著程度大小或者说贡献大小, 由大到小地逐个引入回归方程, 而对那些对多元回归分析原理(4) - cake - Cake的个人主页作用不显著的变量可能始终不被引人回归方程。另外, 己被引人回归方程的变量在引入新变量后也可能失去重要性, 而需要从回归方程中剔除出去。引人一个变量或者从回归方程中剔除一个变量都称为逐步回归的一步, 每一步都要进行多元回归分析原理(4) - cake - Cake的个人主页检验, 以保证在引人新变量前回归方程中只含有对多元回归分析原理(4) - cake - Cake的个人主页影响显著的变量, 而不显著的变量已被剔除。

  逐步回归分析的实施过程是每一步都要对已引入回归方程的变量计算其偏回归平方和(即贡献), 然后选一个偏回归平方和最小的变量, 在预先给定的多元回归分析原理(4) - cake - Cake的个人主页水平下进行显著性检验, 如果显著则该变量不必从回归方程中剔除, 这时方程中其它的几个变量也都不需要剔除(因为其它的几个变量的偏回归平方和都大于最小的一个更不需要剔除)。相反, 如果不显著, 则该变量要剔除, 然后按偏回归平方和由小到大地依次对方程中其它变量进行多元回归分析原理(4) - cake - Cake的个人主页检验。将对多元回归分析原理(4) - cake - Cake的个人主页影响不显著的变量全部剔除, 保留的都是显著的。接着再对未引人回归方程中的变量分别计算其偏回归平方和, 并选其中偏回归平方和最大的一个变量, 同样在给定多元回归分析原理(4) - cake - Cake的个人主页水平下作显著性检验, 如果显著则将该变量引入回归方程, 这一过程一直继续下去, 直到在回归方程中的变量都不能剔除而又无新变量可以引入时为止, 这时逐步回归过程结束。

2、逐步回归分析的主要计算步骤

(1) 确定多元回归分析原理(4) - cake - Cake的个人主页检验值

  在进行逐步回归计算前要确定检验每个变量是否显若的多元回归分析原理(4) - cake - Cake的个人主页检验水平, 以作为引人或剔除变量的标准。多元回归分析原理(4) - cake - Cake的个人主页检验水平要根据具体问题的实际情况来定。一般地, 为使最终的回归方程中包含较多的变量, 多元回归分析原理(4) - cake - Cake的个人主页水平不宜取得过高, 即显著水平α不宜太小。多元回归分析原理(4) - cake - Cake的个人主页水平还与自由度有关, 因为在逐步回归过程中, 回归方程中所含的变量的个数不断在变化, 因此方差分析中的剩余自由度也总在变化, 为方便起见常按多元回归分析原理(4) - cake - Cake的个人主页计算自由度。多元回归分析原理(4) - cake - Cake的个人主页为原始数据观测组数, 多元回归分析原理(4) - cake - Cake的个人主页为估计可能选人回归方程的变量个数。例如多元回归分析原理(4) - cake - Cake的个人主页, 估计可能有2~3个变量选入回归方程, 因此取自由度为15-3-1=11, 查多元回归分析原理(4) - cake - Cake的个人主页分布表, 当α=0.1, 自由度多元回归分析原理(4) - cake - Cake的个人主页多元回归分析原理(4) - cake - Cake的个人主页时, 临界值多元回归分析原理(4) - cake - Cake的个人主页, 并且在引入变量时, 自由度取多元回归分析原理(4) - cake - Cake的个人主页多元回归分析原理(4) - cake - Cake的个人主页多元回归分析原理(4) - cake - Cake的个人主页检验的临界值记多元回归分析原理(4) - cake - Cake的个人主页, 在剔除变量时自由度取多元回归分析原理(4) - cake - Cake的个人主页多元回归分析原理(4) - cake - Cake的个人主页多元回归分析原理(4) - cake - Cake的个人主页检验的临界值记多元回归分析原理(4) - cake - Cake的个人主页, 并要求多元回归分析原理(4) - cake - Cake的个人主页, 实际应用中常取多元回归分析原理(4) - cake - Cake的个人主页

(2) 逐步计算

  如果已计算多元回归分析原理(4) - cake - Cake的个人主页步(包含多元回归分析原理(4) - cake - Cake的个人主页=0), 且回归方程中已引入多元回归分析原理(4) - cake - Cake的个人主页个变量, 则第多元回归分析原理(4) - cake - Cake的个人主页步的计算为:

(多元回归分析原理(4) - cake - Cake的个人主页)计算全部自变量的贡献多元回归分析原理(4) - cake - Cake的个人主页(偏回归平方和)。

(多元回归分析原理(4) - cake - Cake的个人主页)在已引入的自变量中, 检查是否有需要剔除的不显著变量。这就要在已引入的变量中选取具有最小多元回归分析原理(4) - cake - Cake的个人主页值的一个并计算其多元回归分析原理(4) - cake - Cake的个人主页值, 如果多元回归分析原理(4) - cake - Cake的个人主页, 表示该变量不显著, 应将其从回归方程中剔除, 计算转至(多元回归分析原理(4) - cake - Cake的个人主页)。如多元回归分析原理(4) - cake - Cake的个人主页则不需要剔除变量, 这时则考虑从未引入的变量中选出具有最大多元回归分析原理(4) - cake - Cake的个人主页值的一个并计算多元回归分析原理(4) - cake - Cake的个人主页值, 如果多元回归分析原理(4) - cake - Cake的个人主页, 则表示该变量显著, 应将其引人回归方程, 计算转至(多元回归分析原理(4) - cake - Cake的个人主页)。如果多元回归分析原理(4) - cake - Cake的个人主页, 表示已无变量可选入方程, 则逐步计算阶段结束, 计算转人(3)。

(多元回归分析原理(4) - cake - Cake的个人主页)剔除或引人一个变量后, 相关系数矩阵进行消去变换, 第多元回归分析原理(4) - cake - Cake的个人主页步计算结束。其后重复(多元回归分析原理(4) - cake - Cake的个人主页)~(多元回归分析原理(4) - cake - Cake的个人主页)再进行下步计算。

  由上所述, 逐步计算的每一步总是先考虑剔除变量, 仅当无剔除时才考虑引入变量。实际计算时, 开头几步可能都是引人变量, 其后的某几步也可能相继地剔除几个变量。当方程中已无变量可剔除, 且又无变量可引入方程时, 第二阶段逐步计算即告结束, 这时转入第三阶段。

(3) 其他计算, 主要是计算回归方程入选变量的系数、复相关系数及残差等统计量。

  逐步回归选取变量是逐渐增加的。选取第多元回归分析原理(4) - cake - Cake的个人主页个变量时仅要求与前面己选的多元回归分析原理(4) - cake - Cake的个人主页-1个变量配合起来有最小的残差平方和, 因此最终选出的多元回归分析原理(4) - cake - Cake的个人主页个重要变量有时可能不是使残差平方和最小的多元回归分析原理(4) - cake - Cake的个人主页个, 但大量实际问题计算结果表明, 这多元回归分析原理(4) - cake - Cake的个人主页个变量常常就是所有多元回归分析原理(4) - cake - Cake的个人主页个变量的组合中具有最小残差平方和的那一个组合, 特别当多元回归分析原理(4) - cake - Cake的个人主页不太大时更是如此, 这表明逐步回归是比较有效的方法。

  引人回归方程的变量的个数多元回归分析原理(4) - cake - Cake的个人主页与各变量贡献的显著性检验中所规定的多元回归分析原理(4) - cake - Cake的个人主页检验的临界值多元回归分析原理(4) - cake - Cake的个人主页多元回归分析原理(4) - cake - Cake的个人主页的取值大小有关。如果希望多选一些变量进人回归方程, 则应适当增大检验水平α值, 即减小多元回归分析原理(4) - cake - Cake的个人主页的值, 特别地, 当多元回归分析原理(4) - cake - Cake的个人主页时, 则全部变量都将被选入, 这时逐步回归就变为一般的多元线性回归。相反, 如果α取得比较小, 即多元回归分析原理(4) - cake - Cake的个人主页多元回归分析原理(4) - cake - Cake的个人主页取得比较大时, 则入选的变量个数就要减少。此外, 还要注意, 在实际问题中, 当观测数据样本容量多元回归分析原理(4) - cake - Cake的个人主页较小时, 入选变量个数多元回归分析原理(4) - cake - Cake的个人主页不宜选得过大, 否则被确定的系数多元回归分析原理(4) - cake - Cake的个人主页的精度将较差。

 

  逐步回归分析的例子请参见多元回归分析经典例子的计算中的逐步回归法计算的例子和结果


本系列转自:http://hutangao.blog.163.com/blog/static/4888314200982852442975/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值