![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
SOT
文章平均质量分 90
zz的大穗禾
正确而聪明地行动
展开
-
单目标追踪——【工具】汉明窗(Hamming window)
引入余弦窗就是为了解决边界效应,而解决的方法就是在目标原始像素上乘一个余弦窗使接近边缘的像素值接近于零。原创 2023-09-15 11:46:28 · 706 阅读 · 0 评论 -
单目标追踪——【Transformer】Autoregressive Visual Tracking
ARTrack 利用目标先前帧的预测位置,建模目标运动信息来辅助当前的目标追踪定位。原本的基于帧的追踪任务(次最优化**)变成了**序列追踪任务(最优化),这一点与目标追踪本身的定义一致。2. 端到端的实现,没有预测头和后置操作。3. 受到Pix2Seq的启发,利用相似的构建离散的坐标体系与Vision feature一同输入后续的Decoder。4. 与先前SwimTrack将目标运动信息作为特征输入Decoder再借助Head输出定位相比,ARTrack 旨在用先前的轨迹教会模型如原创 2023-08-31 13:50:12 · 1111 阅读 · 0 评论 -
单目标追踪——【Transformer】SwinTrack: A Simple and Strong Baseline for Transformer Tracking
1. 以目标检测领域的Swin Transformer为基础,构建全Transformer结构的目标追踪算法——Swin-Track2. 构建了**Motion Token** 在追踪中考虑到了目标运动信息,在增加计算复杂度的情况下提升性能。3. 将原有的Transformer中的absolute位置编码替换成untied positional encoding。4. 用varifocal loss替换交叉熵损失函数。原创 2023-08-29 17:13:42 · 583 阅读 · 0 评论 -
单目标追踪——【相关滤波】C-COT原理与ECO基于C-COT的改进
文章针对上述问题,基于C-COT做如下改进: - 提出因式分解卷积算子,对C-COT中的卷积滤波器进行缩减,从而减少模型本身的参数。(对于512维的深度特征+512个卷积滤波器,可以将512个卷积滤波器减到64个,从而剔除了一些不重要的深度特征,降低模型参数。) - 一个为在线更新设计的更加简洁的采样分布的生成模型,降低内存和时间复杂度;增加样本多样性。 - 保守模型更新策略,即降低更新频率,增大更新样本的多样性,继而增强鲁棒性,降低复杂性。原创 2023-03-05 10:22:57 · 1006 阅读 · 0 评论 -
RGB-T追踪——【综述】A Survey for Deep RGBT Tracking.
本篇论文总结了RGBT追踪中那些基于深度学习的方法,并在GTOT, RGBT210, RGBT234 和LASHER这四个公认的Benchmark上面进行对比(应该是直接搬用的论文里面的实验数据,所以并不是所有对比的Tracker都有四个Benchmark的结果)原创 2022-09-19 22:42:08 · 4398 阅读 · 0 评论 -
单目标追踪——【Transformer】ECCV2022-Towards Sequence-Level Training for Visual Tracking
ECCV2022-Towards Sequence-Level Training for Visual Tracking原创 2022-09-01 17:30:28 · 1883 阅读 · 2 评论 -
单目标追踪——【Transformer】MixFormer: End-to-End Tracking with Iterative Mixed Attention
本文的出发点是认为现有的多阶段Siamese追踪框架【特征提取-特征融合-边界框预测】的前两步【特征提取-特征融合】统一完成。【特征融合】是对template、Search Region特征进行融合。是将template、Search Region的图片像素拼在一起,利用自注意力机制完成特征提取增强、交叉注意力机制完成特征交叉融合。以上提到的其实是考虑到空间特征,而从时序上考虑,则应用模板更新策略,以应对遮挡等挑战。这个模块的作用既提取特征也融合特征。自注意力(self-attention)提取。...原创 2022-08-25 15:40:52 · 1296 阅读 · 0 评论 -
RGB-T追踪——【数据集基准】GTOT / RGBT210 / RGBT234 / VOT-2019-2020 / LasHeR / VTUAV
这个数据集出自2016IEEETransactionsonImageProcessing(T-IP)的文章,安徽大学李成龙课题组。数据集包括带统计偏差的50个视频对(以灰度图片-热红外图片对的序列)、视频对应的每帧GroundTruth注释、两个评估指标。视频对是对齐的灰度图片和热红外图。视频拍摄场景有16个,包括实验室、校园道路、操场、水池等等。数据集的统计特性包括评价指标预测框与真值框之间的中心位置距离。由于是小目标,所以这里阈值也由常用的20像素改成5像素。.........原创 2022-07-25 23:33:54 · 13071 阅读 · 43 评论 -
单目标追踪——【相关滤波】MOSSE:Visual Object Tracking using Adaptive Correlation Filters
MOSSE算得上是公认的将相关滤波引入目标追踪中的工作。然而在读了原文之后,发现原文中在部分就回顾了一个ASEF方法,MOSSE就是这个方法正则化的变体,但是克服了ASEF的缺点,速度提高了一个数量级,达到了惊人的669fps。所以可以说是,这样的高的追踪速度使得MOSSE所代表的相关滤波在目标追踪中声名大振吧。之后便有一系列工作围绕相关滤波展开。文章如有不当之处,欢迎批评指正。...原创 2022-07-23 11:20:17 · 571 阅读 · 0 评论 -
单目标追踪——【相关滤波】ATOM:Accurate Tracking by Overlap Maximization
好啦,这篇论文读到这里就差不多啦,虽然对文中顶重要的数学推导跳过了,我好菜。有看到关于这部分的好的推导欢迎评论。强强zzz。原创 2022-07-15 14:14:55 · 1203 阅读 · 0 评论 -
单目标追踪——【Transformer】Transformer Tracking
这篇文章是利用Transformer设计了一个新的基于注意力的特征融合网络和一个Siamese结构的集成该融合网络的追踪方法TransT。 在TransT中该融合网络以替换传统Siamese框架中的correlation相关操作。几个值得注意的点:这个模块主要就是多头自注意力机制+位置编码Sin函数。与原始的Transformer中的多头自注意力机制一样。所以这个模块叫上下文语境的增强模块也正是因为Transformer中Encoder的自注意力的全局特性。这个模块应用了Transformer的Dec原创 2022-07-05 16:58:49 · 5419 阅读 · 0 评论 -
单目标追踪——【Transformer】Learning Spatio-Temporal Transformer for Visual Tracking
这篇文章提出了一个端到端的Transformer架构,一共有两个具体实现的网络结构——Baseline网络【仅考虑空间特征】+ST网络【同时考虑时序和空间特征】几个值得注意的点:网络组成部分:上图是同时考虑时空的STARK网络结构。蓝色部分是与对空间建模的STARK一样的结构,粉色部分是对时间建模。这个网络结构的输入加入了一个动态模板,就相当于同时考虑到目标外观的变化。这部分实现主要就是一个Score Head。从左到右分别是 【动态模板, 初始模板, 搜索区域】组成的输入三元组、最后一层Enco原创 2022-07-05 10:33:12 · 822 阅读 · 0 评论 -
单目标追踪——【Transformer】Transformer Meets Tracker:Exploiting Temporal Context for Robust Visual Tracking
这篇文章重点是引入Transformer作为特征提取增强模块。 既是用自注意力对backbone提取的特征进行增强,利用交叉注意力机制使得Template的特征和Search Region的特征交叉增强,有助于后面目标定位。几个注意点:如图所示,Template Features 【这里的Template实际上有20个,这个参数是在消融实验中验证能达到最高的精度。】 和 Search Features是初步经过Backbone(ResNet5......原创 2022-07-03 23:13:24 · 1644 阅读 · 1 评论 -
单目标追踪——【相关滤波】领域发展时间线及典型论文+传统相关滤波和基于深度学习的相关滤波简介
对单目标追踪中相关滤波的框架梳理:传统和基于深度学习。原创 2022-07-02 13:09:44 · 1438 阅读 · 0 评论 -
单目标追踪——【孪生网络】SiamMask论文阅读笔记
提出的SiamMask方法可以完成目标追踪任务和目标分割任务。初始化简化为视频跟踪的box输入即可,同时得到box和mask两个输出。原创 2022-07-02 12:46:39 · 1703 阅读 · 0 评论 -
单目标追踪——【手工特征和深度特征】
写在前面最近看了几篇单目标追踪领域的综述论文,想着对单目标追踪领域的经典论文按照时间线进行梳理一下,以便能快快找到现在单目标追踪的研究热点,未来方向。论文链接:Visual Object Tracking with Discriminative Filters and Siamese Networks: A Survey and OutlookRecent advances of single-object tracking methods: A brief survey视频单目标跟踪研究进展综原创 2022-06-06 22:46:31 · 2602 阅读 · 0 评论 -
单目标追踪——常见的评价指标和评估方法梳理
目录评估指标精确度(Precision)归一化的精确度(Norm. Prec)成功率(Success Rate/IOU Rate/AOS)EAO评估方法OPETRESRE评估指标精确度(Precision)归一化的精确度(Norm. Prec)成功率(Success Rate/IOU Rate/AOS)EAO评估方法OPETRESRE...原创 2022-04-14 15:21:55 · 17430 阅读 · 5 评论 -
单目标跟踪——【数据集基准】RGB数据集OTB / NFS / TrackingNet / LaSOT / GOT-10k / UAV123 / VOT 简介
入手单目标跟踪的三个方面之数据集目前单目标跟踪领域有哪些公认比较好的数据集? 这可以从一些优秀论文中找,看他们在验证自己的tracker用到哪些数据集。这些数据集的侧重不一,有的会包含快速移动;有的包含出视野;有的会侧重测试tracker的长时记忆,所以熟悉一些常用数据集极其特性很有必要,这些数据集往往也有不同的评价指标。 数据集的评价指标不一,是为了更全面的测评tracker的性能。OTB2013和OTB2015OTB2013 [paper]和OTB2015 [paper]这两个数据集别名原创 2022-04-13 08:15:34 · 7827 阅读 · 2 评论