线性回归中的平方损失和正规方程

好好学习Py

于 2024-07-16 23:44:49 发布

阅读量291

点赞数 9

分类专栏：机器学习文章标签：线性回归算法回归人工智能 python numpy

本文链接：https://blog.csdn.net/weixin_74254879/article/details/140478732

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

损失函数

损失函数是用来衡量机器学习模型性能的一个函数。它通过计算模型的预测值与真实值之间的误差，用一个实数来表示这种误差。误差越小，说明模型的性能越好，预测越准确。在确定损失函数之后，通过优化算法求解损失函数的极小值，从而确定机器学习模型中的最佳参数，使模型在训练数据上的表现尽可能好。

平方损失

线性回归的损失函数通常用平方损失表示，如下：

$J(w) = \sum_{i=1}^{n}(h(x_{i})-y_{i})^2$

$n$ 是样本数量。
$y_{i}$ 是第 $i$ 个样本的实际值。
$h(x_{i})$ 是第 $i$ 个样本的预测值。
$h(x_{i})=w_{1}x_{1}+w_{2}x_{2}+w_{3}x_{3}+...+b=w^{T}x+b$
$w$ 、 $b$ 为模型参数

正规方程可以找到平方损失的最优解时的 $w$ 、 $b$

正规方程

$w = (x^{T}x)^{-1}x^{T}y$

$J(w)=\sum_{i=1}^{n}(w^{T}x_{i}-y_{i})^2=(w^{T}x_{1}-y_{1},w^{T}x_{2}-y_{2},...,w^{T}x_{n}-y_{n})\cdot \begin{pmatrix}w^{T}x_{1}-y_{1} \\ w^{T}x_{2}-y_{2} \\ ... \\ w^{T}x_{n}-y_{n} \end{pmatrix}=(w^{T}x^{T}-y^{T})\cdot (xw-y)=w^{T}x^{T}xw-2w^{T}x^{T}y+y^{T}y$
则：

$\frac{\partial J}{\partial w}=2x^{T}xw-2x^{T}y$

令导数为0：

$2x^{T}xw-2x^{T}y=0$

则：

$x^{T}xw=x^{T}y$

即：

$w = (x^{T}x)^{-1}x^{T}y$

import numpy as np
from sklearn.linear_model import LinearRegression



# 特征值（面积和房间数）
x = np.array([[1200, 3],
              [1500, 4],
              [1700, 3],
              [2000, 5],
              [2100, 4],
              [2300, 5],
              [2500, 4],
              [2700, 5]])

# 目标值（房屋价格，单位：千美元）
y = np.array([300, 350, 370, 400, 410, 450, 480, 500]).reshape(-1, 1)

# 给特征值增加一列1（用于计算截距）
ones_array = np.ones([x.shape[0], 1])
x = np.hstack([ones_array, x])

# 使用正规方程公式计算 w 和 b
w = np.linalg.inv(x.T @ x) @ x.T @ y
print('正规方程计算结果：[%.1f %.1f %.1f]' % (w[0][0], w[1][0], w[2][0]))

# 使用 LinearRegression 求解
estimator = LinearRegression(fit_intercept=False)  # 已经包含截距项，无需再拟合截距
estimator.fit(x, y)

# 获取系数并分别格式化
intercept, coef_area, coef_rooms = estimator.coef_[0]
print(f'LinearRegression 计算结果：[{intercept:.1f} {coef_area:.1f} {coef_rooms:.1f}]')

# 输出结果
# 正规方程计算结果：[截距面积系数房间数系数]
# LinearRegression 计算结果： [截距面积系数房间数系数]

正规方程计算结果：[147.0 0.1 -1.8]
LinearRegression 计算结果：[147.0 0.1 -1.8]

好好学习Py

关注

9
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
线性回归中的平方损失和正规方程

损失函数是用来衡量机器学习模型性能的一个函数。它通过计算模型的预测值与真实值之间的误差，用一个实数来表示这种误差。误差越小，说明模型的性能越好，预测越准确。在确定损失函数之后，通过优化算法求解损失函数的极小值，从而确定机器学习模型中的最佳参数，使模型在训练数据上的表现尽可能好。
复制链接

扫一扫