SiamNet 系列方法总结

21 篇文章 75 订阅
5 篇文章 3 订阅

这篇文章中总结了SiamFC之后到2020年已经发表在CVPR,ECCV,ICCV,AAAI上的SiamNet相关文章,没有附带论文链接,有兴趣的同学可以去看我们持续更新的SOT/MOT方法更新github:
https://github.com/JudasDie/Comparison
其中包含文章的链接及论文打包下载地址。

回归正题:其实所有的Siamnet的改进最终都是围绕着两个目的,一个是获得更加精确的相应,确定目标位置(如改进backbone,改进corelation方式等),一个是获得更加精确的下一帧物体尺寸信息(如引入RPN,Mask,Achor free方法等),而这都是当前方法去获得下一帧更加精确跟踪的基础,构建帧与帧的时序关联。


1、SiamFC

开篇之作,思路简单,通过backbone(AlexNet)来获得模板和检索区域的特征,并将模板特征做为卷积核在检索区域上执行卷积操作,获得heatmap,显示相应高的地方。关于框回归用了多尺度来提高鲁棒性。
在这里插入图片描述

2、DSiam(ICCV2017)

作者提出一个Dynamic Siamese Network,可以使用一个transformation learning model来在线学习目标的外观变化并且压制背景信息。本文的另一个创新点在于作者提出了一个自适应聚合各个层的特征的方法(elementwise multi-layer fusion),该方法改进的目的是获得更好的目标定位。
在这里插入图片描述

3、SiamRPN(CVPR18)

针对于SiamFC中只用了多尺度没有框回归方法。所以引入了RPN获得更高精度的框回归。
在这里插入图片描述

4、SASiam(CVPR18)

做了两个分支,两个分支是分开训练的AlexNet。通过两个分支相结合,又加了一个channel的attention,就得到了好结果,框回归沿用了SiamFC的多尺度。

在这里插入图片描述

5、StruckSiam(ECCV2018)

与SiamFC相比,添加了三个模块。1)加入了Local Pattern Detection(局部模式检测)来提高对局部区域的感知程度。(用两种尺度的卷积来做并不是很懂)2)加入了Context Modeling将上一步的特征去噪,平滑,计算每个局部模式之间的关系。3)Integration Module有点像全局池化操作,作者认为由于不同的模式代表search region中不同的区域,如果是像SiamFC那样直接对比,会使得search region对变形很敏感,所以文章就把模板输出整合成向量,每个通道都代表一个模式。
在这里插入图片描述

6、SiamTri(ECCV2018)

提出一种新的triple loss用于SiamNet的学习。

7、DaSiamRPN(ECCV2018)

加入大量检测数据来提高模型的性能,解决相应分数不可靠问题,及heatmap上的定位问题。


8、UpdateNet(ICCV2019)

UpdataNet的思想是通过对模板进行更新,考虑了第一帧模板的信息,上一帧模板的信息以及上一帧用于匹配的模板信息,通过一系列卷积激活,来获得当前帧用于匹配的模板。这种方法不属于上述的两种改进,但是想去考虑更加鲁棒性的匹配模板。
在这里插入图片描述

9、SiamRPN++(CVPR2019)

这篇工作主要围绕的改进点是原有的SiamNet只能用AlexNet作为backbone,如果用更深的网络如ResNet会造成性能的下降。为此这篇文章研究了如何将ResNet50应用在SiamNet中,改进点如图所示。
在这里插入图片描述

10、SiamMask(CVPR2019)

SiamMask是在SiamRPN的两分支基础上提出了mask分支,为了获得更好框回归性能。需要注意的是,Mask的获得是基于score分支的结果的,及通过score的分数获得一个向量,在提及的refine path将向量反向扩展成mask。
在这里插入图片描述
在这里插入图片描述

11、SiamDW(CVPR2019)

SiamDW的工作是分析了原来深度网络不能直接应用的问题,然后对其做出了改进对backbone中的block做了重新设计,使其更加适合于SOT这个任务。
在这里插入图片描述

12、SiamFC++(AAAI2020)

SiamFC++是一个achor free的方法,方法的主要改进是框的回归方式,觉得RPN的anchor-based的方法有歧义性,容易引入很多歧义信息,所以通过四层特征层来表征四个方向的偏移量。
在这里插入图片描述

13、SiamAttn(CVPR2020)

这篇工作的motivation是通过自注意力机制对特征进行加强,并想通过“互注意力机制”提高检索区域和模板之间的关联性。自注意力很好理解,互注意力机制是通过另一个自注意力分支,将特征做了调制之后加入了另一个分支的特征之中。我个人觉得这个并没有去考虑到相关联性。
在这里插入图片描述

14、SiamBAN(CVPR2020)

这个文章的思路也是引入了anchor free的思想。通过学习前景和背景两个类别图来做定位(语义分割中的做法,可能作者觉得更加鲁棒吧),框回归学习了偏移量。
在这里插入图片描述

15、SiamR-NN(CVPR2020)

这个文章的思路是通过引入两阶段方法,SiamRCNN实现了对对象大小和长宽比变化的强大鲁棒性,这在使用流行的SiamNet中是很难实现的。(这个应该很影响实时性)。
在这里插入图片描述

16、Ocean(ECCV2020)

Ocean也是一篇文章,提出通过anchor free方法来提升的操作。和SiamFC++有些像。但是这里有个online update Network取得了很大的性能提升,这也是有道理的,离线训练的模型要适应所有情况其实很难基本不大可能,长时肯定会跟丢。
在这里插入图片描述

  • 4
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: SiamMOT是一种基于Siamese网络的多目标跟踪算法,它可以同时跟踪多个目标,并且在速度和准确度方面都有很好的表现。该算法使用了深度学习技术,通过学习目标的特征来进行跟踪,具有很强的鲁棒性和适应性。在实际应用中,SiamMOT已经被广泛应用于视频监控、自动驾驶等领域。 ### 回答2: SiamMOT是指SiamMOT算法,是一种基于SiamRPN++和深度学习的多目标追踪算法。它主要通过在目标检测的基础上,根据目标的视觉特征进行跟踪,实现对多个目标同时进行跟踪的功能。 SiamMOT算法采用Siamese网络结构,该网络结构以两个相同的子网络组成,用于学习目标的特征。子网络通过共享权重,实现对同一个目标的不同视角的特征提取。通过特征提取,SiamMOT能够把同一目标的特征映射到相同的空间中,从而实现目标跟踪。 SiamMOT算法主要包含三个主要的步骤:第一步是目标检测,利用目标检测算法进行目标的初步识别,获取目标的位置和尺寸信息;第二步是特征提取,通过Siamese网络提取目标的特征,将不同视角下的特征映射到相同的空间中;第三步是目标跟踪,根据目标的特征匹配策略,利用目标的运动信息和外观特征进行目标的连续跟踪。 SiamMOT算法具有高效、准确的特点,能够在复杂背景下跟踪多个目标,并且能够实现实时运行。它在视频监控、自动驾驶、行人跟踪等领域有着广泛的应用前景,为目标跟踪研究提供了有效的方法和思路。 ### 回答3: SiamMot是一种基于SiamNet的多目标跟踪算法。SiamNet是一种基于孪生网络的方式,用于目标跟踪任务。在SiamMot中,孪生网络首先用于提取目标的特征向量。这些特征向量能够捕捉到目标的关键信息,例如目标的外观和运动。然后,通过计算特征向量之间的相似度,可以将目标在连续帧中进行匹配。 SiamMot采用了一种离线训练和在线跟踪的方式。在训练阶段,使用大量的视频序列进行训练,以学习目标的特征和运动模式。在跟踪阶段,根据目标在第一帧中的位置,使用SiamNet提取目标的特征向量,并与后续帧中的特征进行匹配。通过计算特征之间的相似度,可以确定目标在连续帧中的位置。 相比传统的多目标跟踪算法,SiamMot具有许多优势。首先,它能够在复杂的场景中实现准确的目标跟踪。其次,SiamMot在目标外观变化和运动模式变化的情况下都具有较好的适应性。此外,SiamMot具有较高的实时性能,能够处理高帧率的视频流。 总之,SiamMot是一种基于SiamNet的多目标跟踪算法,通过提取目标的特征向量,并计算特征之间的相似度,实现准确且稳定的目标跟踪。这种算法在目标追踪领域具有广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值