降低损失--梯度下降法

最新推荐文章于 2024-06-15 11:56:23 发布

dengao9681

最新推荐文章于 2024-06-15 11:56:23 发布

阅读量148

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/taro/p/8637314.html

版权

假设我们有时间和计算资源来计算w1的所有可能值的损失。对于我们一直在研究的回归问题，所产生的损失与w1的图形始终是凸形。如下图所示：

图2回归问题产生的损失与权重图为凸形

凸形问题只有一个最低点，即只存在一个斜率正好为0的位置。这个最小值就是损失函数收敛之处。

通过计算整个数据集中w1每个可能值的损失函数来找到收敛点的这种方法效率太低。我们来研究一种更好的机制，这种机制在机器学习领域非常热门，称为梯度下降法。

梯度下降法的第一个阶段是为w1选择一个起始值(起点)。起点的选择并不重要，因此很多算法就将w1设置为0或一个随机的值。下图显示的是我们选择的一个稍大于0的起点：

图3梯度下降的起点

然后，梯度下降法会计算损失曲线在起点处的梯度。简而言之，梯度是偏导数的矢量，它可以让你了解那个方向距离目标更近或更远，损失相对于单个权重的梯度就等于导数。

梯度是一个矢量，具有两个特征：

大小
方向

梯度始终指向损失函数中增长最为迅猛的方向。梯度下降算法会沿着负梯度的方向走一步，以便尽快降低损失。

图4 梯度下降法依赖于负梯度

为了确定损失函数曲线上的下一个点，梯度下降算法会将梯度大小的一部分与起点相加，如下图所示：

图5一个梯度步长将我们移动到损失曲线上的下一个点

然后，梯度下降法会重复此过程，逐渐接近最低点。

引用

降低损失 (Reducing Loss)：梯度下降法

转载于:https://www.cnblogs.com/taro/p/8637314.html

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
降低损失--梯度下降法

假设我们有时间和计算资源来计算w1的所有可能值的损失。对于我们一直在研究的回归问题，所产生的损失与w1的图形始终是凸形。如下图所示：图2回归问题产生的损失与权重图为凸形凸形问题只有一个最低点，即只存在一个斜率正好为0的位置。这个最小值就是损失函数收敛之处。通过计算整个数据集中w1每个可能值的损失函数来找到收敛点的这种方法效率太低。我们来研究一种更好的机制，这种机制在机...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。