ECCV 2018 StructSiam：《Structured Siamese Network for Real-Time Visual Tracking》论文笔记

最新推荐文章于 2024-08-09 07:33:29 发布

NeverMoreH

最新推荐文章于 2024-08-09 07:33:29 发布

阅读量2k

点赞数 1

分类专栏：目标跟踪 # 2018年论文文章标签： ECCV2018 目标跟踪

本文链接：https://blog.csdn.net/ms961516792/article/details/84797273

版权

目标跟踪同时被 2 个专栏收录

43 篇文章 4 订阅

订阅专栏

2018年论文

20 篇文章 1 订阅

订阅专栏

整体结构

本文的模型结构如下图所示：
在这里插入图片描述

创新点

本文的改进我觉得十分新颖：“每张特征图学习跟踪目标的一个局部结构”，模板经过卷积后得到 $1\times 1\times 4096$ 大小的特征图，每张特征图代表该物体的一个属性（特征），基于此特征图做相似计算。
从上图来看，我们可以知道，文中主要有三个新增加的部分，分别是“Local Pattern Detection”、“Context Modeling”和“Integration Module”。
“Local Pattern Detection"部分是通过两个卷积层（ $11\times 11$ 和 $5\times 5$ ）实现的，输出的每张特征图代表一个局部特征。
“Context Modeling”部分通过“消息传递”机制实现，使用的是CRF（条件随机场）。作用是压制背景噪声、加强特征。
“Integration Module”部分通过 $6\times 6$ 卷积核实现，将模板帧的特征图由 $6\times 6\times 4096$ 变为 $1\times 1\times 4096$ （其实就是变成了一个向量，向量中的每个值代表该物体的一个属性，和全局均值池化类似）。