细粒度图像分类检索（一）

最新推荐文章于 2023-12-14 23:59:42 发布

孟孟单单

最新推荐文章于 2023-12-14 23:59:42 发布

阅读量924

点赞数

分类专栏：论文阅读文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LWD19981223/article/details/124667078

版权

论文阅读专栏收录该内容

4 篇文章 0 订阅

订阅专栏

目录

1. 细粒度图像任务是什么
2. 数据集

1. 细粒度图像任务是什么

【参考链接】：细粒度图像分类算法全解，附数据集总结！

在传统图像分类中，无论重要判别区域占整个图像的比重有多大，都会对整张图片一视同仁的提取特征，但在一些判别区域占图像比重较小的图片中，进行同样的处理时，大量不重要的信息被提取，增加了图像分类的难度，降低分类的准确度。因此引入“细粒度图像分类”，关注图像中细小的差别，实现更精确的图像分类。

细粒度图像分类是在区分出基本类别的基础上，进行更精细的子类划分，如区分鸟的种类、车的款式、狗的品种等，目前在工业界和实际生活中有着广泛的业务需求和应用场景。

细粒度图像相较于粗粒度图像具有更加相似的外观和特征，加之采集中存在姿态、视角、光照、遮挡、背景干扰等影响，导致数据呈现类间差异性大、类内差异性小的现象，从而使分类更加具有难度。

2. 数据集

(1) CUB-200

CUB-200是细粒度图像分类领域最经典，也是最常用的一个数据库，共包含200种不同类别、11788张鸟类图像数据。同时，该数据库提供了丰富的人工标注数据，每张图像包含15个局部区域位置、312个二值属性、1个标注框以及语义分割图像。

(2) Stanford Dogs

作为Stanford数据库的系列之一，该数据库提供了120种不同种类的狗的图像数据，共有20580张图，只提供标注框。

(3) Stanford Cars

在对狗的不同类别进行构建后，Stanford团队又对车辆进行了详细的汇总和收集，提供196类不同品牌不同年份不同车型的车辆图像数据，一共包含有16185张图像，只提供标注框信息。

(4) Oxford Flowers

Oxford团队构建的花朵数据库共包含102种类别，每个类别包含了40到258张图像数据，共有8189张图像。该数据库只提供语义分割图像 , 不包含其他额外标注信息。

（这个表格来源于参考链接，它说的不可乱用，就先截个图摆在这里看一下）

在这里插入图片描述

相关竞赛：

FGVC Workshop
Kaggle

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

孟孟单单 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。