(ICIP-2018)用于深度图像检索的加权广义平均池化

本文介绍了用于深度图像检索的加权广义平均池化(wGeM)方法,该方法通过学习权重来强调对图像匹配重要的局部信息,改善了图像表示,并提高了标准基准的检索性能。wGeM块可以应用于多种CNN架构,并通过端到端学习进行微调,无需额外的边界框注释。相比于传统的池化技术,wGeM能够更好地排除无信息区域,减少了视觉实例的混淆。
摘要由CSDN通过智能技术生成

用于深度图像检索的加权广义平均池化

paper题目:WEIGHTED GENERALIZED MEAN POOLING FOR DEEP IMAGE RETRIEVAL

paper是日本NTT公司发表在ICIP 2018的工作

paper地址:链接

ABSTRACT

卷积激活上的空间池化(例如,最大池化或总和池化)已被证明在学习用于图像检索的深度表示方面是成功的。然而,大多数池化技术都假设每个激活都同样重要,因此它们会允许无信息图像区域的存在,这些区域在匹配方面起负面作用或导致特定视觉实例的混淆。为了解决这个问题,本文提出了一个可训练的构建块,它引导汇集对当前任务很重要的局部信息。该方法将池化定义为加权广义均值 (wGeM),其中在激活时学习权重,反映图像匹配中每个激活的判别能力。将 wGeM 嵌入深度网络可改善图像表示并提高标准基准的检索性能。 wGeM 不需要任何边界框注释,而是从头开始学习激活的潜在概率。它甚至超越了客观性,学会了观察重要的视觉细节,而不是感兴趣目标的整个区域。

索引词——深度卷积网络、图像检索、学习排序、池化、加权广义均值

1. INTRODUCTION

微调深度网络以学习深度图像表示已被证明可以显着改善图像检索。更重要的是通过结合 1) 良好的预训练分类网络、2) 良好的池化方法和 3) 排序损失来直接优化网络与检索任务中使用的相似性。以前,使用了许多池化方法,从全连接层到全局池化方法,包括总和池化、最大池化、广义平均 (GeM) 池化、区域池化和聚合技术。这些方法中的大多数对卷积层的激活执行统一池化,其中每个激活都对全局表示的构建做出同等贡献。

然而,空间均匀池化会受到激活的影响,这些激活对匹配起负面作用或导致特定视觉实例的混淆。为了解决这个问题,Gordo 等人提出了一种区域proposal网络(RPN),该网络经过训练可以定位图像中感兴趣的对象。 RPN 学习在目标级别预测区域proposal,其中并非所有信息都对最终检索任务很重要。它还需要用于训练的边界框注释和大量的预处理工作。Kalantidis等在总和池化之前应用空间加权来提升同时发生大量强激活的位置并降低不太活跃的位置的权重。然而,他们工作中的权重层是不可训练的,并且激活强度可能与位置的判别力无关。

本文提出利用空间加权机制对最后一个卷积层的激活进行池化。这种方法预测了一个权重,该权重描述了在图像匹配和检索方面如何区分每个位置的每个激活。本文的想法受到视觉注意力的启发,视觉注意力已成功应用于图像字幕、机器翻译和目标识别。通过扩展它并将其与池化和学习排序相结合,将这种机制引入图像检索任务,从而基于一种新颖的加权广义均值 (wGeM) 池化方法实现深度表示的端到端学习。 Sum pooling、max pooling和GeM pooling都是wGeM的特例。本文的方法还推广了Kalantidis的方法,同时使加权机制可训练。与预测物体刚性边界框的RPN不同,wGeM从头开始学习激活的潜在概率。本文的方法不需要进行训练的边界框注释,不需要昂贵的预处理或任何关于训练数据集的假设。证明了将wGeM结合到深度网络中可以改善图像表示并提高标准基准的检索性能。

2. PROPOSED METHOD

2.1. Network Architecture and Learning


提出的 wGeM 可以应用于任何卷积神经网络 (CNN),例如AlexNet、VGG和ResNet。这种经过图像分类训练的 CNN 在执行检索微调时提供了良好的初始化。给定图像 I mathbf{I} I,CNN的输出是一个三维张量 X ∈ R H × W × K mathbf{X} in mathbb{R}^{H imes W imes K} X∈RH×W×K, K K K 是通道的数量,其全连接层被丢弃了。现在添加一个wGeM块,将 X mathbf{X} X 作为输入并产生一个 l 2 l^{2} l2 归一化的描述符 y  ̄ ∈ R K overline{mathbf{y}} in mathbb{R}^{K} y∈RK 作为输出。关于wGeM的细节在第2.2节中提供。<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值