线性回归介绍之十——多因素分析策略

在多重线性回归中,许多人都会碰到这样的情形:单因素分析有统计学意义,而多因素分析则无统计学意义了。这种情况令很多人头疼,不知道到底该相信哪一个结果。今天就这种情况进行以下阐述,使大家对此有些了解。

比如,描述身高、体重对血压的影响。单因素分析也就是分别做身高对血压、体重对血压的影响分析。结果显示身高和体重对血压的变化都有影响。多因素分析就是将身高、体重同时做对血压的影响分析,结果发现身高对血压的影响无统计学意义了,体重对血压的影响有统计学意义。

上述例子仅是一个最简单的例子,相信很多人都碰到过类似情况。这种情况下,我们需要小心了。

首先需要明白,单因素分析中,自变量对因变量的影响,不仅仅反映自变量本身的作用,由于自变量之间一般存在一定的相互作用,因此,自变量的作用还包含了其它因素的间接作用或交互作用。比如上述的例子,单因素分析中,身高对血压的影响,不仅反映了身高的影响,还有体重的影响。同样,体重对血压的影响,也不仅仅是体重的单独作用,还有身高的间接作用。

而多因素分析中,自变量对因变量的作用是扣除了其他变量的影响后的作用,比如上例,多因素分析中,身高对血压的影响,反映的是扣除了体重的作用后,身高对血压的“纯”作用。同样,体重对血压的影响,反映的是扣除了身高的作用后,体重对血压的“纯”影响。

说到这里,估计大家就会大致明白,我们应该相信哪个结果了。实际分析中,还可以通过标准化偏回归系数(standardized partial coefficient of regression)还比较到底哪个因素对因变量的作用更大。通常,各个自变量之间的单位是不同的,比如身高是cm,体重是kg,二者无法比较作用大小。而标准化系数则将它们都转化为无单位的系数,这样就可以直接比较对因变量的影响大小了。

最后对这个例子再说明一下,单因素分析中,身高对血压有影响,而多因素分析中,身高对血压变的无影响。这表明,身高对血压的影响更多地是由于体重的作用而对血压产生影响,换句话说,身高本身对血压无影响,但是由于体重与身高关系密切,因而身高的本身作用加上体重的作用,就对血压有影响了。而一旦扣除了体重的作用(即多因素分析的结果),身高对血压的作用就不明显了。

这个例子仅仅是一个最简单的例子,实际中的情况可能还要复杂的多。总之,数据分析是复杂的,需要深入理解各变量之间的关系,才能正确地进行分析。

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值