论文阅读笔记 | (ECCV 2018 Oral) Multi-Attention Multi-Class Constraint for Fine-grained Image Recognition

论文来自百度研究院,文章研究的主题是细粒度图像分类。

论文下载:Multi-Attention Multi-Class Constraint for Fine-grained Image Recognition

Abstract

1. 现有方法存在的问题和挑战

对于细粒度图像识别(fine-grained image recognition),基于注意力学习(attention-based learning)仍然是一项具有挑战性的任务,其中大多数现有方法对于关键部位的检测是独立的,而忽略了它们之间的相关性。此外,所涉及的多阶段或多尺度机制使现有方法效率较低且难以端到端地进行训练。

2. 本文提出的方法

文章提出了一种新的基于注意力的卷积神经网络(CNN),在不同输入图像之间调节(regulate)多个对象部分。

3. 具体步骤

首先通过one-squeeze multi-excitation(OSME)模块学习每个输入图像的多个注意区域特征(attention region features),然后将multi-attention multi-class constraint(MAMC)应用于度量学习(metric learning)框架中。对于每个anchor特征,MAMC通过拉近相同注意力的同类特征来发挥作用,同时推开不同注意力或不同类别的特征。

4. 效果

该方法可以很容易地进行端到端训练,并且非常高效,只需要一个训练阶段。此外,文章还介绍了Dogs-in-the-Wild数据集,一个全面的狗物种数据集,超过了类似的现有数据集的范畴覆盖,数据量和注释质量。通过大量的实验证明了提出的方法在四个基准数据集上的实质性改进。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值