论文阅读:SMILEtrack: SiMIlarity LEarning for Multiple Object Tracking

github:https://github.com/WWangYuHsiang/SMILEtrack

arxiv:https://arxiv.org/pdf/2211.08824.pdf

一、文章贡献:

1、 提出了一种新的reid网络Similarity Learning Module (SLM)

2、SLM组件Image Slicing Attention Block (ISA)

3、提出一种新的检测框和gt框匹配的方法Similarity Matching Cascade (SMC) 

二、框架

 SMILEtrack采用TBD(先检测后匹配)范式。首先通过检测头得到检测框,然后通过运动近似度和外貌相似度进行数据关联。

三、Similarity Learning Module (SLM) for Re-ID

 为了提取更加有区别度的外貌特征,作者提出SLM用于Re-ID。首先通过共享权重的ISA得到Attentined feature,然后再通过fully connected layer得到外貌特征,最后算两者间的相似度。

1、ISA

不同于标准的transformer的一维输入 ,为了减少2维图片的计算量,ISA首先将图片按照左上、右上、左下、右下分成四张小图片A、B、C、D,然后通过卷积层得到Image slicing。分别给四个切片添加一维的位置embeddingEp=1,2,3,4,得到切片序列:S={Sa~Sd}。通过Q-K-V attention块,进行如下计算:

 其中SA为self-attention,CA为cross-attention。再将特征拼接在一起得到最后的图像特征。

四、SMC

两阶段匹配:首先匹配高检测分数的检测框,然后匹配剩下的检测分数低的框和剩下的轨迹。

1、第一阶段匹配:

计算运动相似度矩阵、高检测分数的检测框目标和跟踪目标的外貌相似度矩阵,得cost矩阵:

2、第二阶段匹配:

首先计算低检测得分的目标和剩余未匹配轨迹的匹配的运动相似度矩阵。低检测分数的目标往往都是伴随着遮挡的发生,如果与轨迹最近的一帧计算外貌相似度,那得分必然会很低。为了解决这问题,将低检测分数的目标与一个轨迹保存的很多帧外貌特征计算外貌相似度,取最大值作为结果:

 通过下面这个式子得到cost矩阵:

 3、更新跟踪目标

对于未匹配检测分数大于阈值的目标,将他作为新的跟踪目标。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
fsim: a feature similarity index for image quality assessment代码是用于图像质量评估的一种特征相似性指数。 该代码是在图像处理领域中常用的一种评估指标,用于量化图像质量的好坏程度。它基于图像的特征相似性来评估图像的质量,而不是简单地比较图像的像素值。 该代码的实现基于一系列的图像特征。它会对输入的两幅图像进行特征提取,然后计算这些特征之间的相似性。其中特征可以包括颜色、纹理、对比度等。 通过计算特征之间的相似性,可以得到两幅图像的相似度。这个相似度的数值可以作为图像质量的评估指标。如果两幅图像的特征相似度高,那么它们的质量就相似。反之,如果相似度低,则意味着图像质量较差。 这个代码对于图像质量评估非常有用。在图像处理领域中,我们经常需要评估算法对图像质量的影响。通过使用fsim代码,我们可以定量地评估算法对图像质量的改善程度。 同时,这个代码也可以用来比较不同图像处理算法之间的效果。通过计算不同算法处理后图像的质量评估指标,我们可以选择最佳的算法进行图像处理。 总而言之,fsim: a feature similarity index for image quality assessment代码是一种用于图像质量评估的特征相似性指数。它通过计算图像特征之间的相似性来评估图像的质量,可以用于算法的质量评估和算法选择。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值