写在前面:
理解多元线性回归模型前,要有一元线性回归的基础
略略略:学个明白:啥是一元线性回归模型——数据分析学习记录
一,抛出问题
生活中,通常决定一件事事情的因素有很多,就构成了多变量,比如预测广告的点击率可能需要广告的位置、类型、投入成本等等信息,最后预测的结果是点击率。
数据集可以按照以下方式表示:
写成矩阵的样子就是这样:
其中,
代表第
行第
个变量也就是第
个观测第
个数据,
代表第
个观测结果。我们知道构造目标函数需要一个和截距项误差项,那矩阵就有这四个了:
我们可以写出这个多元线性回归模型的公式:
简单提一下,这里的观测量和自变量个数一定要满足,不然后面的矩阵无法求解(详细原因看后面的回归文章,还未写)
好了现在我们有公式了,可以进行求解了
二,求解多元线性回归模型
下面是公式的具体推导,不想看推到的朋友建议直接跳到结果:
最后这个
就是我们需要的偏回归系数参数了,下面用python和一个产品利润的数据来实现多元线性回归模型。
三,建模实例
代码和数据获取:
链接:https://pan.baidu.com/s/1rhT1B7aDKaR8juVoXk0Y1w
提取码:kemv
代码:
# 导入第三方模块
总结: