线性回归介绍之三——线性回归的使用条件

线性回归使用范围如此广泛,可惜真正正确使用的却为数不多。从国内的医学杂志情况来看,线性回归的使用都是信手拈来,丝毫不考虑自己的数据是否符合线性回归的使用条件。国内医学杂志80%以上的统计应用都是错误的,这一点已经有专门的有心人发现了。

线性回归使用之前,有几个前提是一定要考虑的:(1)自变量与因变量是否呈直线关系。(2)因变量是否符合正态分布。(3)因变量数值之间是否独立。(4)方差是否齐性。
其实如果正规地来说,应该是看残差(residual)是否正态、独立以及方差齐。所谓残差,就是因变量的真实值与估计值之间的差值。

如果你对这些条件觉得不知道怎么判断,那么有一个简单的方法一定是你乐意了解的。所有的这些条件都可以通过一种方式来判断,即绘制散点图。

是否呈直线关系,这个很简单,在上一篇文章中已经介绍过了。如下图所示,必须大致呈直线关系。

  线性回归介绍之三——线性回归的使用条件 - medstats - 卫生统计空间

是否正态分布,可以用残差的正态概率图来看,目前用sas、spss等都可以轻松地做出来。如下图,如果正态概率呈一条直线,表明符合正态分布。当然,还可以通过各种正态性检验方法检验是否符合正态分布。

  线性回归介绍之三——线性回归的使用条件 - medstats - 卫生统计空间

是否方差齐,可以用残差的分布来看,即以因变量的预测值为x轴,以残差为y轴作图,如果残差无明显的分布,表明方差齐性。如果有一定的趋势,可能存在方差不齐的情况,如下图随着x轴的增加残差的范围逐渐增大,明显的方差不齐的情形。

  线性回归介绍之三——线性回归的使用条件 - medstats - 卫生统计空间

对于是否独立,也可以通过图形来看, 随着时间的变化,因变量应该没有任何趋势,否则可能表明因变量之间有一定的相关性。还可通过Durbin-Watson法检验是否独立。

  线性回归介绍之三——线性回归的使用条件 - medstats - 卫生统计空间

正规地来说,应用线性回归分析之前,必须对这四个条件进行检验。如果条件不符合仍然使用线性回归,即使得出结果,也不准确。试想一下,前提都不对,怎么保证后面的结果正确呢?实际上,做任何事情,前提都是极为重要的,离开了前提,就相当于南辕北辙,大方向都错了,怎么达到正确的目的呢?

  • 8
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值