【机器学习】003_线性回归模型Part.2_理论过程(2)

Cyan.__

已于 2023-10-14 22:33:38 修改

阅读量117

点赞数

分类专栏：机器学习文章标签：机器学习线性回归人工智能

于 2023-10-10 23:58:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yukiice/article/details/133757052

版权

机器学习专栏收录该内容

45 篇文章 1 订阅

订阅专栏

本文介绍了线性回归中的成本函数，特别是平方误差成本函数的应用，以及如何通过梯度下降法找到最佳参数值。还提及了线性模型简化示例和参数学习过程，总结了线性回归的基本原理和测量预测精度的方法。

摘要由CSDN通过智能技术生成

一、成本函数——衡量拟合程度

成本函数：衡量模型预测与 $y$ 的真实值之间的差异。

在线性回归模型中，对误差值进行预估： $e = \left | y-\widehat{y} \right |$ (error)

由此，构建出一个对误差值进行评估的成本函数（平方误差成本函数）：

$J(w,b) = \frac{1}{2m}\sum_{i=1}^{m}(\widehat{y}^{(i)}-y^{(i)})^2$

其中， $m$ 表示训练数据的数据个数。

其中， $\widehat{y}$ 表示函数对某个训练数据的预测值。

因此，该成本函数也可以重写为：

$J(w,b) = \frac{1}{2m}\sum_{i=1}^{m}(f_{w,b}(x^{(i)})-y^{(i)})^2$

※ 针对不同的应用程序，成本函数也有所不同，但平方误差成本函数是迄今为止线性回归最常用的函数。

要想使得最终的预测结果更精确，应该找到使函数更小的 $w,b$ 的值，即：

$minimize_{w,b} J(w,b)$

设置 $b=0$ ，仅对 $w$ 的值进行分析：

如上图所示，绘制 $J(w)$ 关于 $w$ 的函数示意图，我们会发现：使 $J(w)$ 的值越小的 $w$ 值更能让预测函数更好地与训练数据拟合。通常地，一般取 $J(w )$ 函数的最小值点（极小值点），也就是斜率等于0的点所对应的 $w$ 值。

对 $b$ 和 $w$ 的值同时进行分析：

对二元复合函数来说，可以用3D图的形式呈现出它的效果↑：

但还有另外一种方式去表现 $J(w,b)$ 的值随 $w,b$ 的变化而不需要3D化的呈现。那就是利用等高线图——最低点就在等高线图中线最密集的地方，这里代表 $J(w,b)$ 的值最小。

当然，在后续训练模型的过程中，不必借助图像去手动寻找 $w,b$ 最合理的数值，而是可以编写算法去找到它们——直接算出使成本函数 $J(w,b)$ 最小的 $w,b$ 的值。

这种找到 $w,b$ 的最合适的值算法，也就是梯度下降和梯度下降的变体算法。

二、线性回归的简化模型样例

线性模型：

· 给定一个n维输入： $x = \left [ x_{1},x_{2},...,x_{n} \right ]^{T}$

` 线性模型有一个n维权重参数和一个标量偏差参数：

$w = \left [ w_{1},w_{2},...,w_{n} \right ]^{T}, b$

` 输出是输入的加权和：

$y = w_{1}x_{1}+w_{2}x_{2}+...+w_{n}x_{n}+b$

样例假设：

· 假设1：影响房价的关键因素是卧室个数、卫生间个数、居住面积，记为 $x_{1},x_{2},x_{3}$ .

` 假设2：成交价格是关键因素的加权和：

$y = w_{1}x_{1}+w_{2}x_{2}+w_{3}x_{3}+b$

权重和偏差的实际值在后面决定。

衡量预估质量：

· 比较真实值和预估值，例如房屋售价和估价。

$l(y,\widehat{y}) = \frac{1}{2}(y-\widehat{y})^2$

这个叫做平方损失（ $\frac{1}{2}$ 的处理是为了之后求导消去平方的方便）。

训练数据：

· 收集一些数据点来决定参数值（权重与偏差），例如过去6个月卖的房子。

· 假定我们有n个样本，记：

$X = \left [ x_{1},x_{2},...,x_{n} \right ]^{T}$

$Y = \left [ y_{1},y_{2},...,y_{n} \right ]^{T}$

参数学习：

· 训练损失（损失函数）：

$l(X,Y,w,b) = \frac{1}{2n}\sum_{i=1}^{n}(y_{i}-< x_{i},w>-b)^2 = \frac{1}{2n}\left \| Y-Xw-b \right \|^2$

· 最小化损失函数来学习参数：

$w_{*},b_{*} = arg min_{w,b}l(X,Y,w,b)$

显示最优解，找到最优的 $w,b$ 值（线性回归模型较为简单，因此可以显示解）。

三、总结

1. 线性回归是对n维输入的加权，外加偏差。

2. 使用平方损失来衡量预测值和真实值的差异。

3. 线性回归模型可以看作一个单层神经网络。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】003_线性回归模型Part.2_理论过程(2)

【学习打卡】机器学习_003：对线性回归模型成本函数的学习，对权重最优化初步
复制链接

扫一扫

专栏目录

Cyan.__ CSDN认证博客专家 CSDN认证企业博客

码龄2年

47: 原创

40万+: 周排名

13万+: 总排名

1万+: 访问

: 等级

506: 积分

23: 粉丝

34: 获赞

15: 评论

39: 收藏

私信

关注

热门文章

分类专栏

Linux 1篇
机器学习 45篇
C++ 1篇

最新评论

【机器学习】044_Kaggle房价预测（机器学习模型实战）
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【机器学习】040_理解偏差与方差
白话机器学习: 博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文
【机器学习】041_模型开发迭代过程
白话机器学习: 内容丰富图文并茂，认真看完收获很大。思路清晰细节满满，支持大佬优质好文。
【机器学习】019_缺失值处理
CSDN-Ada助手: 恭喜你写完了第20篇博客！标题看起来非常有意思，关于缺失值处理的内容一定会对读者有所帮助。你在机器学习领域的持续创作让人佩服，真的很高兴看到你的进步。在下一步的创作中，或许可以考虑分享一些关于特征选择或者模型评估的技巧，这些主题也是非常受欢迎的。再次恭喜你，并期待你未来更多博客的发布！
【机器学习】001_监督学习与非监督学习
CSDN-Ada助手: 非常恭喜你开始了博客创作的旅程！标题看起来非常有吸引力，机器学习的内容一直备受关注。监督学习与非监督学习是机器学习中的两个重要概念，期待你能够深入探讨这两个主题，给读者带来更多的见解和启发。在下一步的创作中，或许可以考虑介绍一些具体的监督学习和非监督学习的算法或示例，这样读者能够更好地理解它们的应用和区别。再次祝贺你的第一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。