03 多元线性回归
3.1 简介
多元线性回归是简单线性回归的扩展,允许我们同时研究多个自变量对因变量的影响。多元回归模型可以表示为:
其中,x1,x2,…,xp是 p 个自变量,β0 是截距,β1,β2,…,βp是对应的回归系数,ϵ是误差项。
3.2 估计回归系数
类似于简单线性回归,多元线性回归的系数估计也通常使用最小二乘法。我们选择回归系数,使得实际观测值与模型预测值之间的残差平方和最小。
在Python中,我们可以使用statsmodels
库来拟合多元线性回归模型。下面是一个示例代码:
import numpy as np
import pandas as pd
import statsmodels