《机器学习》梯度下降

最新推荐文章于 2024-02-01 15:12:40 发布

VIP文章 aszxqw

最新推荐文章于 2024-02-01 15:12:40 发布

阅读量1.5w

点赞数

文章标签： matrix c

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wuyanyi/article/details/8003946

版权

参照《机器学习》这本书的第4.4.3节。

一.解决目标及情景假设:

当给定一些数据，输入x向量已知，输出y也已知，设计一个线性函数y=h（x）去拟合这些数据。

既然是线性函数，在此不妨设为h（x）=w0*x0+w1*x1。

此时我们遇到的问题就是如何确定w0和w1这两个参数，即w=（w0，w1）这个向量。

既然是拟合，则拟合效果可以用误差函数：E（w）=∑ [ h（x）- y ] ^2 / 2 来衡量。

其中w是权重二维向量，x是输入二维向量，x和y都是训练集的数据，即已知。

至于后面除于2只是为了之后的推导过程中对E求导时候可以消除系数，暂时可以不管。

因为我们解决的目标是找出一个向量w=（w0，w1）使得E(w)值最小，即误差最小。

其实这个问题本质上也是搜索最优解的问题，如果用暴力搜索的话，随机取每个可能的值去让机器每天每夜地跑，显然这是不可能的。
所以此时有一种搜索策略：梯度下降。

二. 梯度下降方法：

梯度其实就是高数求导方法，对E这个公式针对每个维数（w0，w1）求偏导后的向量▽E(w)=（∂E/∂w0,∂E/∂w1）

梯度为最陡峭上升的方向，对应的梯度下降的训练法则为：

w=w-η▽E(w)

这里的η代表学习速率，决定梯度下降搜索中的步长。

最低0.47元/天解锁文章

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
3
评论
《机器学习》梯度下降

参照《机器学习》这本书的第4.4.3节。一.解决目标及情景假设:当给定一些数据，输入x向量已知，输出y也已知，设计一个线性函数y=h（x）去拟合这些数据。既然是线性函数，在此不妨设为h（x）=w0*x0+w1*x1。此时我们遇到的问题就是如何确定w0和w1这两个参数，即w=（w0，w1）这个向量。既然是拟合，则拟合效果可以用误差函数：E（w）=∑ [ h（x）- y ] ^2
复制链接

扫一扫

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。