【转载】CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

最新推荐文章于 2022-11-16 09:28:29 发布

机器视觉-zjuer

最新推荐文章于 2022-11-16 09:28:29 发布

阅读量353

点赞数

https://baijiahao.baidu.com/s?id=1627432661257652978&wfr=spider&for=pc

Motivation: 视频跟踪到底是跟踪什么？

长久以来，我们的思维倾向于陷入舒适区。当 A 做了物体检测，我们尝试改网络，改 loss，别的领域 trick 拿来就是一篇。而我们常常忽略了更为重要的问题，到底这个问题的该如何定义，这点极为重要。

对于目标跟踪而言，一般论文开篇通常都会说在第一帧给定目标位置，在后续帧中预测目标的位置。然而如何对后续帧中表述的定义直接影响了整个跟踪领域的发展。

为了方便表述，早期的跟踪算法都是坐标轴对齐的的矩形框。但随着跟踪精度的不断提升，数据集的难度在不断提升，在 VOT2015 时即提出使用旋转矩形框来作为标记。在 VOT2016 的时候提出自动的通过 mask 来生成旋转框的方法。更为本质的，我们会发现，这个旋转的矩形框实际上就是 mask 的一种近似。我们所要预测的实际上就是目标物体的 mask。利用 mask 才能得到精度本身的上界。

机器视觉-zjuer

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【转载】CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

https://baijiahao.baidu.com/s?id=1627432661257652978&wfr=spider&for=pcMotivation:视频跟踪到底是跟踪什么？长久以来，我们的思维倾向于陷入舒适区。当 A 做了物体检测，我们尝试改网络，改 loss，别的领域 trick 拿来就是一篇。而我们常常忽略了更为重要的问题，到底这个问题的该如何定义...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。