线性回归.

最新推荐文章于 2024-09-13 19:03:07 发布

为算法工程师

最新推荐文章于 2024-09-13 19:03:07 发布

阅读量133

点赞数

分类专栏：机器学习文章标签：机器学习 sklearn

本文链接：https://blog.csdn.net/gg13213/article/details/120497567

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文深入讲解了线性回归的基本原理，包括其数学公式、损失函数（均方误差）和优化算法（梯度下降与最小二乘法）。通过Sklearn库实现实例，介绍了如何使用LinearRegression模型，从训练集拟合到预测，并探讨了正态分布假设。最后，展示了交叉验证在模型优化中的应用。

摘要由CSDN通过智能技术生成

线性回归

线性回归假设目标值和特征值之间存在线性相关，即满足多元一次方程。其公式为：
$y^{'} = w * x + b$
$y^{'}$ 为预测值，线性回归模型是利用数据特征，求解 $w ， b$ 两个参数。
损失函数：
$\frac{1}{n} \sum_{k=1}^n (y'_i - y_i)^2$
即预测值和真实值之间的平均的平方距离，MAE（均方误差）
优化算法：梯度下降法和最小二乘法。

代码

sklearn中包含线性回归模型的包

from sklearn.linear_model import LinearRegression
linreg = LinearRegression()
linreg.fit(x_train, y_train)  # 训练集特征x和标签y
linreg.intercept_  # 查看模型偏置系数
linreg.coef_ #查看模型参数系数
y_pred = linreg.predict(x_test)  # 对测试集进行预测

# 利用交叉验证法，对模型进行优化
from sklearn.model_selection import cross_val_predict
pre = cross_val_predict(linreg, x, y, cv=10)

其它

线性回归是一种预测模型，利用各个特征去预测目标值。线性回归的假设前提是噪声符合正态分布。
线性回归要求因变量符合正态分布，这是由于线性回归的假设前提是特征与预测值呈线性关系，误差项符合高斯-马尔可夫条件（零均值，零方差，不相关），此时线性回归为无偏估计。噪声和因变量符合正态分布。
线性回归的五个假设：1.特征和标签呈线性关系；2.误差之间相互独立；3.自变量相互独立；4.误差项的方差应为常数；5.误差呈正态分布。
参考1
参考2