【论文笔记】Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification

论文提出了一种名为Margin样本挖掘损失(MSML)的深度学习方法,该方法在行人重识别(ReID)任务中表现出色,优于传统的triplet loss等度量学习损失。MSML结合了Quadruplet loss和TriHard loss的优点,通过难样本挖掘提高模型准确性。实验证实在Market1501,MARS,CUHK03和CUHK-SYSU数据集上,MSML方法超越了多数state-of-the-art算法。
摘要由CSDN通过智能技术生成

摘要

Person re-identification (ReID) is an important task in computer vision. Recently, deep learning with a metric learning loss has become a common framework for ReID. In this paper, we propose a new metric learning loss with hard sample mining called margin smaple mining loss (MSML) which can achieve better accuracy compared with other metric learning losses, such as triplet loss. In experiments, our proposed methods outperforms most of the state-ofthe-art algorithms on Market1501, MARS, CUHK03 and CUHK-SYSU.

行人重识别是一个计算机视觉领域非常重要的一个任务。基于度量学习方法的深度学习技术如今成为了ReID的主流方法。在本论文中,我们提出了一种新的引入难样本采样的度量学习方法,这种方法叫做MSML。实验表明,我们提出的方法击败了目前大多数的方法,在Market1501,MARS,CUHK03和CUHK-SYSU数据集上取得了state-of-the-arts的结果。

方法

Triplet loss是一种非常常用的度量学习方法,而Quadruplet loss和TriHard loss是它的两个改进版本。Quadruplet loss相对于Triplet loss考虑了正负样本对之间的绝对距离,而TriHard loss则是引入了hard sample mining的思想,MSML则吸收了这两个优点。

度量学习的目标是学习一个函数 g(x):RFRD ,使得 RF 空间上语义相似度反映在 RD 空间的距离上。
通常我们需要定义一个距离度量函数 D(x,y):RD×RDR 来表示嵌入空间(Embedding space)的距离,而这个距离也用来重识别行人图片。

在国内外研究现状里面介绍的三元组损失、四元组损失和TriHard损失都是典型度量学习方法。给定一个三元组 { a,p,n} ,三元组损失表示为:

Lt=(da,pd
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值