【深度学习】细粒度图像识别 (fine-grained image recognition)

JNingWei

已于 2023-01-25 16:31:14 修改

阅读量2.6w

点赞数 9

分类专栏：深度学习文章标签：深度学习人工智能计算机视觉

于 2018-02-02 17:07:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jningwei/article/details/79241193

版权

深度学习专栏收录该内容

79 篇文章

订阅专栏

Introduction

细粒度图像识别 (fine-grained image recognition)，即 精细化分类 。

这里写图片描述

精细化分类

识别出物体的大类别（比如：计算机、手机、水杯等）较易，但如果进一步去判断更为精细化的物体分类名称，则难度极大。

最大的挑战在于，同一大类别下 不同子类别 间的 视觉差异 极小。因此，精细化分类 所需的图像分辨率 较高。

这里写图片描述

目前，精细化分类的方法主要有以下两类：

基于图像重要区域定位的方法：该方法集中探讨如何利用弱监督的信息自动找到图像中有判别力的区域，从而达到精细化分类的目的。

基于图像精细化特征表达的方法：该方法提出使用高维度的图像特征（如：bilinear vector）对图像信息进行高阶编码，以达到准确分类的目的。

RA-CNN

MSRA通过观察发现，对于精细化物体分类问题，其实形态、轮廓特征显得不那么重要，而细节纹理特征则起到了主导作用。

因此提出了 “将判别力区域的定位和精细化特征的学习联合进行优化” 的构想，从而让两者在学习的过程中相互强化，也由此诞生了 “Recurrent Attention Convolutional Neural Network”（RA-CNN，基于递归注意力模型的卷积神经网络）网络结构。

RA-CNN 网络可以更精准地找到图像中有判别力的子区域，然后采用高分辨率、精细化特征描述这些区域，进而大大提高精细化物体分类的精度：
这里写图片描述

这里写图片描述

该项工作已经被CVPR 2017接收。

[1] 基于递归注意力模型的卷积神经网络：让精细化物体分类成为现实
[2] RA-CNN

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。