引言
最近,我收到一位学生的求助,他问我:“郑老师,审稿人说:因变量不符合正态性分布为什么开展多元线性回归,质疑我的统计学方法有问题,我该怎么回复?”
这个问题其实在统计分析中非常常见,但很多研究者都对回归分析的前提条件存在误解。
因此,老郑觉得有必要在这里详细解答一下。
今天,我们统计小食第五篇的主题是:多元线性回归要求因变量一定要符合正态分布吗?不符合正态分布怎么办?
如果你也有统计问题还未解惑,欢迎评论留言,我们将选取一些共性问题,郑老师为您解答!
√回归分析对因变量有什么要求吗?
有的,要求正态分布。
但是这个正态分布不是说因变量Y是正态分布,是残差正态分布或者近似正态分布。
√什么是残差?
残差是真实的Y值和回归模型预测出来的预测值之间的差值,即残差=实际值−预测值。
每个研究对象都有个残差,而所有个体的差值汇总一起,就有一个分布。