损失能收敛到0么深度学习_CVPR 2018 | 加速模型收敛的新思路（控制理论+深度学习）...

最新推荐文章于 2022-04-14 11:15:44 发布

weixin_39575775

最新推荐文章于 2022-04-14 11:15:44 发布

阅读量386

点赞数

文章标签：损失能收敛到0么深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39575775/article/details/111528622

版权

大家熟知的大疆无人机也不例外

下面就来说说控制理论和深度学习优化的关系。在控制理论里，“误差”即受控机器的输出与期望值之间的距离。如何根据“误差”让机器做出下一步更新的算法就是控制器。

对于深度学习优化，将模型输出和期望输出的误差来定义为损失函数。损失函数通过执行“误差的反向传播” [1] 得到梯度来影响权重。就像 Hinton 老先生在其发表在 Nature [1] 的文章里那样描述的，梯度是每个权值对总的损失函数贡献，其与损失函数为线性关系。

把深度学习里的”梯度”看成是当前权重与最优权重的“误差”，这样 SGD-Momentum就与 PID 优化器通过”梯度”与“误差”的联系而联系到了一起。如下图，可以看到控制过程与深度学习的优化过程的联系，可以发现控制系统里的反馈、误差、PID控制器与深度学习里的反响传播、梯度、优化器有着很高的相似度。

如果把控制里的误差用梯度替换掉的话，那么深度学习优化器 SGD-Momentum 和反馈控制器 PID 就有如下的关系：

这样 SGD-Momentum 可以等效为 PI 控制器。而在控制理论中，PI 控制有超调的问题，也就是说 SGD-Momentum 有超调问题，这一点其实很容易理解，因为 I(Integral)是历史梯度的积累。也就是说如果历史梯度朝着同一个方向变化的话，那么朝着该方向的变化就会不断地加速，但是如果要改变方向，那么由于历史梯度还是朝着相反的方向变化，就会产生滞后反应或者也叫超调(Overshoot)的问题。

最低0.47元/天解锁文章

weixin_39575775

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
损失能收敛到0么深度学习_CVPR 2018 | 加速模型收敛的新思路（控制理论+深度学习）...

大家熟知的大疆无人机也不例外下面就来说说控制理论和深度学习优化的关系。在控制理论里，“误差”即受控机器的输出与期望值之间的距离。如何根据“误差”让机器做出下一步更新的算法就是控制器。对于深度学习优化，将模型输出和期望输出的误差来定义为损失函数。损失函数通过执行“误差的反向传播” [1] 得到梯度来影响权重。就像 Hinton 老先生在其发表在 Nature [1] 的文章里那样描述的，梯度是每个权...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。