MDNet视频目标跟踪算法中的重检测机制分析

最新推荐文章于 2023-02-03 11:46:11 发布

越野者

最新推荐文章于 2023-02-03 11:46:11 发布

阅读量950

点赞数

分类专栏：视频目标跟踪（Visual tracking）深度学习（Deep learning）论文笔记（Paper notes）文章标签：视频目标跟踪深度学习 Python Pytorch MDNet

本文链接：https://blog.csdn.net/discoverer100/article/details/100028039

版权

本文深入分析了MDNet视频目标跟踪算法中的重检测机制，该算法通过结合预定位和边框回归阶段增强鲁棒性。在预定位阶段，MDNet基于256个候选目标的得分选择前5个，并计算平均位置。如果这些候选样本的平均得分大于0，则认为目标位置可靠，进而使用MDNet的回归器进行精确定位。若位置不可靠，算法将在下一帧扩大搜索范围以找回目标。

摘要由CSDN通过智能技术生成

1. 论文基本信息

论文标题：Learning Multi-Domain Convolutional Neural Networks for Visual Tracking
论文作者：Hyeonseob Nam（Dept. of Computer Science and Engineering, POSTECH, Korea）等人
论文出处：CVPR 2016
在线阅读：https://arxiv.org/pdf/1510.07945v2.pdf
源码链接1：https://github.com/HyeonseobNam/MDNet （MATLAB版本）
源码链接2：https://github.com/HyeonseobNam/py-MDNet （Python 3.6版本）

本文的参考代码为上述高亮版本的代码。

2. 网络结构图

论文的详细网络结构如下图所示：
在这里插入图片描述

3. 重要变量

MDNet算法在tracking阶段，为了获得更强的鲁棒性，算法采用了检测机制，对不同的情况进行处理。首先看源码中设置的几个关键变量：

result. 它是一个数组，表示计算出来的目标预定位位置 $[x, y, w i d t h, h e i g h t]$ 。
result_bb. 它是一个数组，表示基于上述预定位位置的回归位置 $[x^{'}, y$

最低0.47元/天解锁文章

越野者

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
MDNet视频目标跟踪算法中的重检测机制分析

1. 论文基本信息- 论文标题：Learning Multi-Domain Convolutional Neural Networks for Visual Tracking- 论文作者：Hyeonseob Nam（Dept. of Computer Science and Engineering, POSTECH, Korea）等人- 论文出处：CVPR 2016- 在线阅读：[htt...
复制链接

扫一扫