论文笔记:MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

MatchNet结合了深度卷积网络和三层全链接网络,用于patch匹配。特征网络从图像patch中提取类似SIFT的特征,而度量网络通过Softmax计算匹配度。训练过程采用交叉熵损失,通过特定的采样策略平衡正负样本。尽管存在一些未解的问题,如采样算法和UBC patch dataset的缺失,但MatchNet的网络结构和两阶段预测流程为图像匹配提供了新思路。
摘要由CSDN通过智能技术生成

Abstract

MatchNet:一个用来从patches中提取特征的深度卷积网络 + 一个用来比较提取出的特征相似度的三层全链接网络构成。

Introduction

在MatchNet中,每个patch输入卷积网络,生成一个固定维度的类似SIFT的特征。但与SIFT不同,SIFT中衡量两个descriptors的异同是用欧拉距离来计算;在MatchNet中,用的是一个三层的全链接网络。

这部分介绍相关工作。

Network architecture

总体网络结构如下:
这里写图片描述

包含的不同类型的层的参数如下:
这里写图片描述

具体结构:
Feature network:卷积层用到的激活函数是ReLU。结构是受AlexNet的启发。

Metric network:使用激活函数为ReLU的三层全链接层来比较features间的相似度。FC3使用了Softmax。其输入是一对features。输出是两个在[0,1]之间的浮点型,非负,和为1,代表网络估计两个patches间的匹配度。

Two-tower structure with tied parameters:两个塔状的网络用的是同样的参数。

The bottleneck layer:这一层用来降低feature的维度,并且控制网络的过拟合。它是一个大小为 B 的全链接层,输入为Pool4的大小 (8864) ,输出为 B ,在之后有给出 B 对匹配结果的影响。

The preprocessing layer:预处理层,输入为灰度图,按照目前的惯例对其强度值 x (in [0, 255])正规化, (x128)/160

Training and prediction

Feature and metric networks两个网络一起训练,其cross-entropy error为:
E=

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值