基于深度学习的图像匹配基础知识

本文介绍了基于深度学习的图像匹配,涉及度量学习、Siamese Nets和Triplet Nets的网络结构,以及交叉熵损失和Ranking Loss Function在图像匹配中的应用。网络通过学习使相似样本的表示相近,不同样本表示相远,以优化特征提取器。
摘要由CSDN通过智能技术生成


按照 网络类型:度量学习(metric learning)和描述子学习(local image discriptor)。
按照 网络结构:pairwise的siamese结构、triplet的three branch结构,以及引入尺度信息的central-surround结构(此结构往往在baseline中使用进一步提升结果)。
按照 网络输出:单个概率值(pairwise similarity)、特征向量(feature embedding)。
按照 损失函数:损失函数可以是对比损失函数、交叉熵损失函数、triplet loss、hinge loss等等。此外损失函数可以带有隐式的困难样本挖掘,例如pn-net中的softpn等,也可以是显示的困难挖掘等等。但是困难挖掘就一定好吗?也不一定,可能导致过拟合是的结果变差。

一、网络类型

度量学习

Metric Learning预测输入量之间的相对差异(同生成式),使用Ranking Loss Function(相对应的是交叉熵损失和均方差损失)。
特征提取→特征表示→相似性度量→训练特征提取器,使得相似样本产生相似表示,不同样本产生不同表示;表示形式不重要,重要的是distance。

二、网络结构

Siamese and triplet nets 分别用Pairwise Ranking Loss and Triplet Ranking Loss 来训练,那些losses也可以用在其他setups里。在这两个网络中,使用共享权重相同的网络(具有相同的CNN)来计算pair或triplet中训练样本的表示。

1、Siamese Nets

Pair中两个元素的表示由具有相同权重的两个相同CNN构建(两个CNN具有相同的权重),即由同一个CNN计算得出。这些网络中的每一个都处理图像并产生representation,比较那些representation并计算它们之间的距离。然后,使用Pairwise Ranking Loss来训练网络,使得相似图像产生的表示之间的距离很小,而非相似图像的表示之间的距离很大。
Pairwise Ranking Loss为 L ( x 0 , x 1 , y ) = y ∥ f ( x 0 ) − f ( x 1 ) ∥ + ( 1 − y ) m a x ( 0 , m − ∥ f ( x 0 ) − f ( x 1 ) ∥ ) L(x_0,x_1,y) = y\left \| f(x_0) - f(x_1) \right \| + (1-y) max(0,m - \left \| f(x_0) - f(x_1) \right \|) L(x0,x1,y)=yf(x0)f(x1)+(1y)max(0,mf(x0)f(x1))如果 x 0 x_0 x0 x 1 x_1 x1为匹配对,则 y = 1 y=1 y=1,反之 y = 0 y=0 y=0

一个Pairwise的具体事例见:Learning to Rank w/ Siamese Networks & Pairwise data.

2、Triplet Nets

类似于Siamese Nets,但是Triplet net具有三个分支(三个权重相同的CNN),通过同时给相应的anchor图像a positive and a negative image,并使用Triplet Ranking Loss来训练模型,这样网络可以更好地分类与anchor图像的相似图像和不同图像。
Triplet Ranking Loss为
L ( x a , x p , x n ) = m a x ( 0 , m + ∥ f ( x a ) − f ( x p ) ∥ − ∥ f ( x a ) − f ( x n ) ∥ ) L(x_a,x_p,x_n) = max(0,m + \left \| f(x_a)-f(x_p) \right \| - \left \| f(x_a) - f(x_n) \right \|) L(xa,xp,xn)=max(0,m+f(xa)f(xp)f(xa)f(xn))

四、损失函数

1、交叉熵损失函数

交叉熵损失Cross-Entropy Loss=Logistic Loss,表示为
C E = − ∑ i C t i l o g ( s i ) CE=-\sum _i^Ct_i log(s_i) CE=iCtilog(si) t i t_i ti–groundtruth, s i s_i s

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值