机器学习笔记--误差项及梯度下降

weixin_40271825

已于 2024-04-12 14:46:28 修改

阅读量415

点赞数 4

分类专栏：机器学习文章标签：机器学习人工智能

于 2024-04-09 16:22:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40271825/article/details/137514521

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

误差项定义

假定拟合的平面： $h_{\theta }(x)=\theta _{0} + \theta _{1}x_{1} + \theta _{2}x_{2}$ ，其中 $\theta _{0}$ 是偏置项，控制平面的上下浮动。实际代码中，可能添加一列全1的列，便于矩阵计算： $h_{\theta }(x)= \sum_{i=0}^{n}\theta _{i}x_{i} = \theta ^{T}x$ 。

真实值和预测值之间存在误差 $\varepsilon$ ，对于每个样本： $y^{i} = \theta ^{T}x^{i} + \varepsilon ^{i}$

特点：

误差是独立且具有相同的分布，并且服从均值为0、方差为 $\sigma ^{2}$ 的高斯分布。

①误差服从高斯分布：

$p(\epsilon ^{i}) = \frac{1}{\sqrt{2\pi }\sigma } e^{-\frac{(y^{i}-\theta ^{T}x^{i})^{2}}{2\sigma ^{2}}}$

②预测值与误差：

$\varepsilon ^{i} = y^{i} - \theta ^{T}x^{i}$

由①②有：

$p(y^{i}|x ^{i},\theta ) = \frac{1}{\sqrt{2\pi }\sigma } e^{-\frac{(y^{i}-\theta ^{T}x^{i})^{2}}{2\sigma ^{2}}}$

上式即为，找一个 $\theta$ ，它与 $x^{i}$ 组合完之后，与真实值 $y^{i}$ 越接近越好，即它俩组合完后成为真实值的可能性越大越好。

（以贷款举例）

独立：张三和李四一起来贷款，但他俩不认识、没关系

同分布：他俩都来到同一家银行

高斯分布：银行可能多给、可能少给，但大多数情况下这个浮动不会太大，极小的情况下浮动会比较大

似然函数

累乘前提：独立同分布；希望用的数据越多，结果越准确。通过似然函数(不关心似然函数值)，找到极大值点。

推导得出最小二乘法：

目标函数求解：

tips：

① $X^{T}X$ 必然为一个对称阵；

②若 $A$ 是对称阵，则 $\partial (\theta ^{T}A\theta) = 2A\theta$ ；

梯度下降

机器学习常规套路：是交给机器一堆数据，然后告诉它什么样的学习方式是对的（目标函数），然后让它朝着这个方向去做。

学习过程中的优化：要一步步的完成迭代。

更新参数：

① 找到当前最合适的方向

② 走一小步

③ 按照方向和步伐去更新参数

批量梯度下降：容易得到最优解，但由于每次考虑所有样本，速度很慢。

${\theta _{j}}' = \theta _{j} + \frac{1}{m}\sum_{i=1}^{m}(y^{i}-h_{\theta }(x^{i}))x_{j}^{i}$ ， $i$ 表示第 $i$ 个数据， $j$ 表示第 $j$ 列

随机梯度下降：每次找一个样本，迭代速度快，但不一定每次都朝着收敛方向。

${\theta _{j}}' = \theta _{j} + (y^{i}-h_{\theta }(x^{i}))x_{j}^{i}$

小批量梯度下降：每次更新一小部分数据来算。

${\theta _{j}}' = \theta _{j} + \alpha \frac{1}{10}\sum_{k=1}^{i+9}(y^{k}-h_{\theta }(x^{k}))x_{j}^{k}$

weixin_40271825

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记--误差项及梯度下降

假定拟合的平面：，其中是偏置项，控制平面的上下浮动。实际代码中，可能添加一列全1的列，便于矩阵计算：。真实值和预测值之间存在误差。
复制链接

扫一扫

专栏目录

weixin_40271825

博客等级

码龄7年

2
原创

13
点赞

14
收藏

12
粉丝

关注

私信

热门文章

分类专栏

最新评论

numpy笔记--np.dot()
CSDN-Ada助手: 这篇博客对于使用numpy中的np.dot()函数进行向量点积和矩阵乘法运算进行了详细的介绍，非常清晰易懂。希望作者能够继续分享关于numpy的知识，可以尝试探讨一下numpy中其他常用的线性代数函数，比如np.linalg.det()用于计算矩阵的行列式，或者np.linalg.inv()用于计算矩阵的逆等等。这些知识会对读者的学习和应用numpy库有所帮助。期待作者更多精彩的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
机器学习笔记--误差项及梯度下降
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

numpy笔记--np.dot()

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。