《Collaborative Deep Reinforcement Learning for Multi-Object Tracking》泛读记录

最新推荐文章于 2024-08-09 08:40:22 发布

CsdnWujinming

最新推荐文章于 2024-08-09 08:40:22 发布

阅读量831

点赞数 4

分类专栏：目标跟踪强化学习

本文链接：https://blog.csdn.net/csdnwujinming/article/details/96480505

版权

目标跟踪同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

强化学习

1 篇文章 0 订阅

订阅专栏

文章目录

概述

一种结合强化学习的多目标跟踪框架，目前Tracking by detection 方法依赖目标检测算法准确性，本文希望使用强化学习设计prediction-decision 网络 prediction 部分预测目标新的位置，decision 决定如何使用预测信息与检测信息(detection)。该方法将每个目标视作一个agent，预测网络预测位置，决策网络根据多个目标agent 间关联和与检测结果关联寻找最佳跟踪结果。

方法

网络输入一个视频，以及每帧的检测结果，每个已跟踪的目标作为一个agent，prediction network 预测新的目标位置，下图shift network 会输出新位置的相对位移，decision network 会输入agent 的预测位置和其它agent 的信息以及detection 决策对当前目标 agent进行block ,update, ignore 等操作

在这里插入图片描述

Prediction network 预测网络

输入目标初始位置处的图像块和历史轨迹，输出目标当前帧的位置偏移。四个变量是对应初始位置四个参数的相对偏移。
在这里插入图片描述
训练网络需要样本，在目标初始位置处周围随机选择边框和框内的图像块，训练网络使用预测框与真实框IoU最大

Collaborative Deep Reinforcement Learning

决策网络需要考虑每个agent 与 detection 间的影响与关联，这里只考虑与当前agent(我们要跟踪的目标）相似的其它agent （视频中其它目标）和相似的detection（检测器输出）。
结合边框IoU和目标外观特征衡量一对agent间的距离。
在这里插入图片描述第一项是IoU 信息，第二项是向量余弦距离。
衡量agent 与 detection 之间距离

计算完每对agent { $p_i, p_j$ }, 每对agent 与detection { $p_i, p^*_k$ }后，若 $d(p_i,p_j) < \tau, d(p_i,p^*_k)< \tau$ 说明存在相似的目标物agent 和相似的detection 则将三个图像块输入到决策网络，若 $d(p_i,p_j)> \tau, d(p_i,p^*_k)< \tau$ 说明不存在相似的目标物。则将干扰的目标物 $p_j$ 设为零图