论文:Learning a Discriminative Filter Bank within a CNN for Fine-grained Recognition

Abstract

与早期使用CNN特性的多阶段框架相比,最近采用的端到端深度精细识别方法从本质上提高了CNN的中层学习能力。以前的方法是通过引入一个辅助网络将定位信息注入到主分类网络中,或者通过一个复杂的特征编码方法来获取更高阶的特征统计量来实现这一点。我们证明了中层表示学习可以在CNN框架内得到增强,通过学习一组卷积滤波器来捕获特定的类别有区别的patch而不需要额外的部分或边框标注。该滤波器组具有良好的结构、适当的初始化和鉴别学习,通过一种带有卷积滤波器监督和非随机层初始化的新型非对称多流结构。实验结果表明,我们的方法在3个公开的细粒度识别数据集( (CUB-200-2011, Stanford Cars and FGVC-Aircraf )上达到了最先进的水平。

1. Introduction

细粒度目标识别涉及区分同一超类别的子类别(例如,鸟类、汽车和飞机),解决方案通常利用来自局部区域的信息来捕捉细微的差异。 深度学习在该任务中的早期应用是基于卷积神经网络(CNN)的特点构建了传统的多阶段框架; 现在基本都是基于CNN端到端的学习可以分为两种:1. 定位分类子网络;2. 端到端的特征编码

早期多阶段的框架利用了低层CNN特征寻找具有判别力的区域和语义部分,对这些构建中层表示用于分类。他们对比以前的方法有着不错的效果,这表明了CNN学习中间层表示还有很大的进步空间,基于这个发现,作者想要学习一个提高CNN学习中间层表示能力的一个网络。

  • 定位分类子网络: 由定位网络提供的定位信息增强了分类网络的中层学习能力 ,但这需要额外的标签(bounding boxes, part locations ),而且在分类和定位之间存在着一个权衡(要同时考虑两个任务的准确率), 这可能会降低单个集成网络的分类性能 。
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值