强化学习在视觉上的应用(RL for computer Vision)

本文探讨了深度强化学习(RL)在计算机视觉领域的应用,包括图像修复、目标跟踪和视频总结。RL在图像修复任务中减少了计算量,目标跟踪中解决了样本缺乏的问题,而在视频总结中通过多样性与代表性的奖励函数优化了视频剪辑。RL算法如REINFORCE在这些任务中起到了关键作用。
摘要由CSDN通过智能技术生成

文章 iker peng(知乎:https://www.zhihu.com/people/ikerpeng/)原创,转载请与我联系~

 

 

深度强化学习在很多决策领域当中都取得了比较不错的结果,尤其是在游戏领域,多个游戏已经达到甚至是超过了人类水平。计算机视觉领域,必定也会尝试这种神奇的算法。然而,到目前为止我们并没有看到在这个领域当中特别成功的例子。计算机视觉任务似乎并没有像游戏那样直观的对应到一个决策的环境或者是可解释的动作步骤。然而我们还是能够在顶级的会议当中发现一些他们的踪迹。


早在2014年,Google DeepMind团队就将深度强化学习应用到了注意力机制当中[1]:

最终,网络的训练采用的是一种策略梯度的算法,也就是REINFORCE算法。


那我们接下来看一些在经典的视觉任务当中使用强化学习的例子。

图像修复(image restoration),以下为CVPR2018的文章[4]:

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值