Look Closer to See Better 梅涛大神作品

Look Closer to See Better: Recurrent Attention Convolutional Neural Network
for Fine-grained Image Recognition论文链接

简介:

识别细粒度类别是有困难的,这种困难存在于辨别性的区域定位和细粒度的特征学习,各种各样的方法被提出来应对这些挑战,但是却忽略了也该事实,实际上区域检测和细粒度特征学习是相互协作的,可以加强彼此。这篇论文作者提出了一种新奇的网络结构RA-CNN,它循环的学习辨别性的区域attention和基于区域的特征代表在多种规模上以相互强化的方式。每个规模的学习由分类自我咯和注意力提议子网络APN组成。APN从整张图片开始迭代的产生区域attention由粗到细通过把之前的预测作为引用。同时一个更好规模的网络以一种循环的方式把之前规模网络的不断扩大的区域注意作为输入。这个提出的RA-CNN是通过一种规模内的分类loss和规模建间的排序loss进行优化的,去相互学习精确的区域注意和细粒度的表示。RACNN可以端到端的学习。实验表明很不错。因为好规模的网络可以被堆叠成一种循环的方式,RA-CNNk可以逐渐的致力于从模糊的部分到细粒度的部分辨别区域。这些工作代表着我们是首先提出采用多谷米循环网络去解决细粒度识别的。

关于细粒度图像识别的研究沿着两个维度进行,即判别性特征学习和复杂的局部定位。

Discriminative Feature Learning

学习判别性特征对于细粒度图像识别至关重要。由于深度学习的成功,大多数方法依赖于强大的卷积深层特征,
其在通用和细粒度识别上比手工制作的特征有着显着改善]。为了学习更强大的特征表示,深度残差网络[9]通过优化残差函数将CNN加深到152层,其将ImageNet测试集中的错误率降低到3.75%。为了更好地建模细粒度类别中存在的微妙差异,最近提出一种双线性结构来计算两个独立CNN的成对特征的相互作用来捕获图像的局部差异,这已经取得了鸟类分类中最先进的成果。此外,另一种方法[34]提出用Fisher Vector统一CNN与空间加权表示,显示了在鸟和狗数据集[的优异结果。

Sophisticated Part Localization

以前的工作主要集中在利用边界框和部分注释等额外注释来定位细粒度识别中的重要区域。然而,手动注释的大量劳动使得此任务对于大规模的实际问题不可行。最近,出现了一些新的工作,旨在提出一个更一般的情况,并提出使用无监督的方法来挖掘注意力区域。基于视觉注意力的方法在两者上提出了一个两级域网对象和部分,其中通过聚类方案从CNN中的内部隐藏表示中学习部分模板。 采用深度滤波器响应]和多维描述符提出通过分析来自CNN的过滤器响应来以无监督的方式一致地响应特定模式来学习一组部分检测器。然而,从学习区域定位器依赖于预先处理的区域建议或类别标签,这对精确的区域定位提出了挑战。
这里写图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值