强化学习
文章平均质量分 87
WaitPX
这个作者很懒,什么都没留下…
展开
-
Fast Template Matching and Update for Video Object Tracking and Segmentation学习笔记
Fast Template Matching and Update for Video Object Tracking and Segmentation学习笔记一、创新点传统视频对象跟踪和分割算法步骤第一步,是对当前帧进行实例分割,生成候选提案池。第二步,根据目标模板信息,进行匹配过程,在所有候选方案中找到正确的方案作为最终结果。第三步,是使用当前帧的预测完全替换目标模板。本文作者主要针对后两者的不足进行改进,具体改进如下:(1)为了改进第二步,论文中提供了一种简单的方式,通过选择匹配方法(基原创 2022-03-29 22:21:08 · 445 阅读 · 0 评论 -
Deep Reinforcement Learning for Visual Object Tracking in Videos学习笔记
Deep Reinforcement Learning for Visual Object Tracking in Videos学习笔记1.主要贡献(1)我们提出并开发了一种新的用于视觉跟踪的卷积循环神经网络模型。该方法直接利用深度学习模型的能力自动学习空间和时间约束。(2)我们的框架是使用深度RL算法进行端到端训练的,在这种算法中,模型经过优化,以在长期内最大限度地提高跟踪性能。(3)我们的模型是完全离线训练的。当应用于在线跟踪时,只需计算一次前向传递,无需在线微调,允许我们以超出实时的帧速率运行原创 2022-03-03 22:39:10 · 553 阅读 · 0 评论 -
ADNet学习笔记
Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning学习笔记1.基本原理 本文模型叫做ADNet。该模型通过强化学习产生动作序列(对bbox进行移动或者尺度变换)来进行跟踪。原理如下图(第一列代表初始帧,第二列和第三列代表通过RL产生的动作序列对object进行tracking):2.算法详解2.1 网络结构 ADNet是通过监督学习和强化学习来进行预训练,并在实际跟踪过程中使用在线自适应原创 2022-02-14 22:46:28 · 3606 阅读 · 0 评论 -
强化学习入门
强化学习入门1.基本概念PDF(概率密度函数):连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。PMF(概率质量函数):概率质量函数是离散随机变量在各特定取值上的概率。随机采样:根据事物出现的概率进行采样。为了方便理解,下面都将采用超级马里奥进行说明State:状态当前帧的画面就可以用来表示一个状态,通常情况下不同时间点具有不同的状态。Action:动作Agent:做动作的人或事物等从上图我们可以看原创 2022-01-04 12:07:18 · 327 阅读 · 0 评论