细粒度图像识别初步学习

最新推荐文章于 2024-04-05 13:30:00 发布

qq_37623946

最新推荐文章于 2024-04-05 13:30:00 发布

阅读量2.2k

点赞数 1

细粒度图像识别现在图像分类中一个难点，它的目标是在一个大类中识别子类，比如说在鸟的大类下识别鸟的种类，在车的大类下，识别车的型号。由于相同的子类中物体的动作姿态可能大不相同，不同的子类中物体可能又有着相同的动作姿态，这是识别的一大难点。不止对计算机，对普通人来说，细粒度图像识别的难度和挑战也很巨大。

细粒度图像分类的关键点在寻找一些存在细微差别的局部区域（比如鸟类的喙、眼睛、爪子等），因此，现有的细粒度图像识别算法不但寻找图像中的整个物体（object），还寻找一些有区别的局部（part）。

细粒度图像主要分为两类

1. 基于强监督信息的细粒度图像分类模型

所谓“强监督细粒度图像分类模型”是指：在模型训练时，为了获得更好的分类精度，除了图像的类别标签外，还使用了物体标注框（Object Bounding Box）和部位标注点（PartAnnotation）等额外的人工标注信息，如下图所示。

几个经典模型

Part-based R-CNN

Pose Normalized CNN

Mask-CNN

Mask-CNN中，借助FCN学习一个部位分割模型（part-based segmentation model）。一个图像分为三部分，其中，一部分为头部，一部分为躯干，最后一部分则是背景。

FCN训练完毕后，可以对测试集中的细粒度图像进行较精确地part定位。

将头部，躯干，整个个体输入Mask-CNN模型，即可得到最终的分类

2.基于弱监督信息的分类模型

思路同强监督分类模型类似，也需要借助全局和局部信息来做细粒度级别的分类。而区别在于，弱监督细粒度分类希望在不借助part annotation的情况下，也可以做到较好的局部信息的捕捉。当然，在分类精度方面，目前最好的弱监督分类模型仍与最好的强监督分类模型存在差距（分类准确度相差约1～2%）。

三个弱监督细粒度图像分类模型的代表。

Two Level Attention Model

Constellations

Bilinear CNN

参考https://zhuanlan.zhihu.com/p/24738319

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_37623946 CSDN认证博客专家 CSDN认证企业博客

码龄8年

1: 原创

140万+: 周排名

192万+: 总排名

2522: 访问

: 等级

37: 积分

1: 粉丝

1: 获赞

0: 评论

7: 收藏

私信

关注

热门文章

最新文章

Ubuntu14安装python-pcl

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。