强化学习在视觉上的应用（RL for computer Vision）

最新推荐文章于 2024-01-28 14:34:15 发布

VIP文章 xiaoiker

最新推荐文章于 2024-01-28 14:34:15 发布

阅读量2.8w

点赞数 15

分类专栏： machine learning 深度学习强化学习RL 深度强化学习文章标签：强化学习深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ikerpeng/article/details/89145551

版权

文章 iker peng（知乎：https://www.zhihu.com/people/ikerpeng/）原创，转载请与我联系～

深度强化学习在很多决策领域当中都取得了比较不错的结果，尤其是在游戏领域，多个游戏已经达到甚至是超过了人类水平。计算机视觉领域，必定也会尝试这种神奇的算法。然而，到目前为止我们并没有看到在这个领域当中特别成功的例子。计算机视觉任务似乎并没有像游戏那样直观的对应到一个决策的环境或者是可解释的动作步骤。然而我们还是能够在顶级的会议当中发现一些他们的踪迹。

早在2014年，Google DeepMind团队就将深度强化学习应用到了注意力机制当中[1]：

最终，网络的训练采用的是一种策略梯度的算法，也就是REINFORCE算法。

那我们接下来看一些在经典的视觉任务当中使用强化学习的例子。

图像修复（image restoration），以下为CVPR2018的文章[4]：

最低0.47元/天解锁文章

关注

15
点赞
踩
91

收藏

觉得还不错? 一键收藏
2
评论
强化学习在视觉上的应用（RL for computer Vision）

文章 iker peng（知乎：https://www.zhihu.com/people/ikerpeng/）原创，转载请与我联系～深度强化学习在很多决策领域当中都取得了比较不错的结果，尤其是在游戏领域，多个游戏已经达到甚至是超过了人类水平。计算机视觉领域，必定也会尝试这种神奇的算法。然而，到目前为止我们并没有看到在这个领域当中特别成功的例子。计算机视觉任务似乎并没有像游戏那样直观...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。