SiamCAR: Siamese Fully Convolutional Classification and Regression for Visual Tracking 阅读记录

最新推荐文章于 2024-12-10 18:54:21 发布

时闻折竹

最新推荐文章于 2024-12-10 18:54:21 发布

阅读量908

点赞数

分类专栏： Paper速看文章标签：计算机视觉人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZeroSwift/article/details/113562410

版权

SiamCAR是一种基于Siamese网络的视觉跟踪方法，将任务分解为像素分类和边界框回归。使用ResNet-50并避免描点，减少了人工干涉和超参数调整。通过联合训练分类和回归分支，实现目标尺度不变性，提高跟踪效率。文章对比其他跟踪算法，强调了无描点和模板更新策略对精度和效率的影响，以及如何利用低层和高层特征提高跟踪精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

将视觉跟踪任务分解成两个子任务：像素分类和边界框回归
SiamCAR框架包含两个子网络：一个用于特征提取，一个用于预测边界框
使用ResNet-50作为主干网络
与其他的最先进的跟踪算法比较，本文提出的框架是描点自由和无提议区域，这样能够避免复杂的超参数调整和减少人工干涉
所提出的框架简单，有效
在现实生活中的跟踪，算法会受到光照变化，尺度变化大，背景干扰和严重遮挡问题
除上述外，非刚性的物体的形状或者外观会发生不可预知的变化
Siamese网络将视觉跟踪任务定义为目标匹配问题，目的是学习目标模板和搜索区域之间的相似图
由于单个相似图像通常包含有限的空间信息，一种常见的策略实在搜索区域的多个尺度上进行匹配，以确定目标的尺度变化。但是这样也导致了一些追踪器费时费力
通过联合训练一个分类分支和一个回归分支用于跟踪，SiamRPN避免了耗时的步骤，并且也能够提取多尺度特征图的目标尺度不变性
SiamRPN等网络将锚点引入到目标区域中，而跟踪器对描点较为敏感
为了引入描点自由，这篇论文将跟踪问题分解为：分类问题和回归问题
分类分支：目的是将每个像素预测为一个标签
回归分支：将每个位置回归为一个相对的包围框
经过这样分解后，可以以逐像素预测的方式解决跟踪任务
SiamCAR旨在提取包含丰富类别信息和语义信息的响应图
SiamCAR只使用一个响应图去预测物体的位置和包围框

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。