线性回归残差检验、影响点分析、多重共线性问题及问题总结
手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/116331806
知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息
1 背景需求
之前进行了线性回归模型的创立,并进行了预测,但是存在一个问题,为什么模型之后的得分提高了,背后是因为什么?
最开始数据是右偏的,最后进行了调整,取了对数,整个模型的得分就上去了。也就是说线性回归对正态分布的数据会有很好的表现,但是不是正态分布的时候,模型得分不是很好
这时候我们再来回顾一下多元线性回归的前提条件,有了之前的实际操作,熟悉一遍流程之后再回来看看要进行的前提,这样会有一个更容易理解,或者不那么抗拒。多元线性回归总共有6条,分别如下
- (1)Y的平均值能够准确地被由X组成的线性函数建模出来
- (2)解释变量和随机扰动项不存在线性关系