1、前言
Triplet loss是非常常用的一种deep metric learning方法,在图像检索领域有非常广泛的应用,比如人脸识别、行人重识别、商品检索等。传统的triplet loss训练需要一个三元组,包括三张图片:achor,positive,negative,分别简写为a,p,n。==Triplet loss的缺点在于随机从训练集中挑选出三张图片,那么可能会出现挑选出来的很可能是简单的样本,比如很像的正样本对和很不像的负样本对。作者认为,让网络一直学习简单的样本会限制网络的泛化能力,因此提出一种在线batch hard sample mining的改进版triplet loss,我喜欢简写为TriHard loss==。我复现了这种方法,并且大量实验表明,这种改进版的方法效果非常好。
2、方法
首先,假如有两张输入图片 I1 和 I2 ,通过网络的前馈我们可以得到它们归一化后的特征向量 fI1 和 fI2 。我们定义这两张图片特征向量的欧式距离为:
dI1,