1. 细粒度图像任务是什么
【参考链接】:细粒度图像分类算法全解,附数据集总结!
在传统图像分类中,无论重要判别区域占整个图像的比重有多大,都会对整张图片一视同仁的提取特征,但在一些判别区域占图像比重较小的图片中,进行同样的处理时,大量不重要的信息被提取,增加了图像分类的难度,降低分类的准确度。因此引入“细粒度图像分类”,关注图像中细小的差别,实现更精确的图像分类。
细粒度图像分类是在区分出基本类别的基础上,进行更精细的子类划分,如区分鸟的种类、车的款式、狗的品种等,目前在工业界和实际生活中有着广泛的业务需求和应用场景。
细粒度图像相较于粗粒度图像具有更加相似的外观和特征,加之采集中存在姿态、视角、光照、遮挡、背景干扰等影响,导致数据呈现类间差异性大、类内差异性小的现象,从而使分类更加具有难度。
2. 数据集
(1) CUB-200
CUB-200是细粒度图像分类领域最经典,也是最常用的一个数据库,共包含200种不同类别、11788张鸟类图像数据。同时,该数据库提供了丰富的人工标注数据,每张图像包含15个局部区域位置、312个二值属性、1个标注框 以及语义分割图像。
(2) Stanford Dogs
作为Stanford数据库的系列之一,该数据库提供了120种不同种类的狗的图像数据,共有20580张图,只提供标注框。
(3) Stanford Cars
在对狗的不同类别进行构建后,Stanford团队又对车辆进行了详细的汇总和收集,提供196类不同品牌不同年份不同车型的车辆图像数据,一共包含有16185张图像,只提供标注框信息。
(4) Oxford Flowers
Oxford团队构建的花朵数据库共包含102种类别,每个类别包含了40到258张图像数据,共有8189张图像。该数据库只提供语义分割图像 , 不包含其他额外标注信息。
(这个表格来源于参考链接,它说的不可乱用,就先截个图摆在这里看一下)
相关竞赛:
- FGVC Workshop
- Kaggle