目标跟踪基础与智能前沿
寻找 目标跟踪方向的小伙伴,如果你苦于没有地方可以和同方向的小伙伴交流,我们创建了一个交流群,点上方链接可以进入,每周的交流活动通过该号宣传,群里随时随地可以展开讨论,无论是学术交流,还是环境配置,实验讲解,欢迎加入我们,一起交流进步!
点击上方链接,微信关注回复"数据集",获得目标跟踪几大经典数据集下载链接。
文章目录
- 参考学习资料
- 一、ReID方法分类
-
- 研究方法分类以下几个类别:
-
- 1、表征学习(Representation learning)[1-4] :得到行人的特征表示(CNN / 属性),转化成 分类问题\ 验证问题
- 2、 度量学习(Metric learning) : 度量相似度,是的相同行人图片的距离尽可能小、不同行人图片的距离尽可能大
-
- 1) 对比损失(Contrastive loss)[5] : 相同行人的距离越来越小 + 不同行人的距离越来越大
- 2) 三元组损失(Triplet loss) :**固定图片(Anchor) αα**,**正样本图片(Positive)pp** 和 **负样本图片(Negative)nn**:
- 3) 四元组损失(Quadruplet loss): 增加了一个不同类别的负样本
- 4) 难样本采样三元组损失(Triplet loss with batch hard mining, TriHard loss): 距离最远的正样本距离越来越小, 距离最近的正样本距离越来越大
- 5) 边界挖掘损失(Margin sample mining loss, MSML)
- 总结: 各种Loss 性能对比
- 3、局部特征
- 基于视频序列的ReID
参考学习资料
一、ReID方法分类
定义:ReID : 给定一个监控行人的图像, 检索跨设备下的该行人图像。
研究方法分类以下几个类别:
1、 基于表征学习的ReID方法
2、 基于度量学习的ReID方法
3、 基于局部特征的ReID方法
4、 基于视频序列的ReID方法
5、 基于GAN造图的ReID方法
1、表征学习(Representation learning)[1-4] :得到行人的特征表示(CNN / 属性),转化成 分类问题\ 验证问题
CNN可以自动提取出表征特征(Representation)
研究者把行人重识别问题看做分类(Classification/Identification)问题或者验证(Verification)问题:
(1)分类问题是指利用行人的ID或者属性等作为训练标签来训练模型;
(2)验证问题是指输入一对 (两张)行人图片,让网络来学习这两张图片是否属于同一个行人。
论文[1]利用 Classification/Identification loss 和 verification loss 来训练网络,其网络示意图如下图所示。
- Classification/Identification loss :
- ** verification loss :**
也有论文认为光靠行人的ID信息不足以学习出一个泛化能力足够强的模型。
行人属性标注: 在这些工作中,它们额外标注了行人图片的属性特征,例如性别、头发、衣着等属性。通过引入行人属性标签,模型不但要准确地预测出行人ID,还要预测出各项正确的行人属性,这大大增加了模型的泛化能力,多数论文也显示这种方法是有效的。
下图是其中一个示例[2],从图中可以看出,网络输出的特征不仅用于预测行人的ID信息,还用于预测各项行人属性。通过结合ID损失和属性损失能够提高网络的泛化能力。
- ID损失:
- 属性损失:
优点:表征学习的方法比较鲁棒,训练比较稳定,结果也比较容易复现
缺点:容易在数据集的domain上过拟合,并且当训练ID增加到一定程度的时候会显得比较乏力
2、 度量学习(Metric learning) : 度量相似度,是的相同行人图片的距离尽可能小、不同行人图片的距离尽可能大
- 对比损失(Contrastive loss)[5]
- 三元组损失(Triplet loss)[6-8]
- 四元组损失(Quadruplet loss)[9]
- 难样本采样三元组损失(Triplet hard loss with batch hard mining, TriHard loss)[10]
- 边界挖掘损失(Margin sample mining loss, MSML)[11]
首先,假如有两张输入图片和,通过网络的前馈我们可以得到它们归一化后的特征向量:
1) 对比损失(Contrastive loss)[5] : 相同行人的距离越来越小 + 不同行人的距离越来越大
2) 三元组损失(Triplet loss) :固定图片(Anchor) αα,正样本图片(Positive)pp 和 负样本图片(Negative)nn:
三元组损失是一种被广泛应用的度量学习损失,之后的大量度量学习方法也是基于三元组损失演变而来。
三元组损失需要三张输入图片。和对比损失不同,一个输入的三元组(Triplet)包括一对正样本对和一对负样本对。
三张图片分别命名为固定图片(Anchor) αα,正样本图片(Positive)