Fine-Grained Visual Classification (FGVC)

连理o

已于 2023-05-11 16:30:37 修改

阅读量1k

点赞数

文章标签： FGVC

于 2023-02-10 20:16:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42437114/article/details/127194080

版权

papers 专栏收录该内容

39 篇文章 1 订阅

订阅专栏

Contents

Fine-Grained Visual Classification (FGVC)
- Task Description
- Datasets
Learning from Labels of Multi-granularity
Learning Features from Parts
Learning multi-granularity features
- [ECCV 2020] Fine-grained visual classification via progressive multi-granularity training of jigsaw patches
References

Fine-Grained Visual Classification (FGVC)

Task Description

FGVC 是一种对图像的细粒度单标签分类任务，例如将下图分类为 “flamingo” 而非 “bird”
该任务主要有以下难点：
- (1) a lot of variation in the same category
- (2) objects of different subcategories may be very similar
- (3) often requires professional experts to label data, which makes data more expensive

Datasets

CUB: It contains 11,788 images covering 200 species of birds. The dataset is divided into two sets including 5,994 training images and 5,794 test images. The 200 species of birds are grouped into 122 genera, 37 families, and 13 orders by a bird taxonomy hierarchy according to the ornithological systematics. (类别层次关系由如下论文提供 Chen, Tianshui, et al. “Fine-grained representation learning and recognition by exploiting hierarchical semantic embedding.” Proceedings of the 26th ACM international conference on Multimedia. 2018.)
Butterfly-200: It has a hierarchical structure with 200 species, 116 genera, 23 subfamilies, and 5 families according to the insect taxonomy. The dataset contains 25,279 images, including a training set of 5,135 images, a validation set of 5,135 images and a test set of 15,009 images.
VegFru: a dataset with fine-grained vegetables and fruits recognition covering 292 subordinate classes and 25 upper-level categories. VegFru dataset has 29,200 images for training, 14,600 for validation and 116,931 for testing.
FGVC-Aircraft contains 100 fine-grained aircraft models, which are grouped into 70 families and 30 makers by tracing superclasses in Wikipedia pages [4]. The dataset has 10,000 images, 6,667 are for training and 3,333 for evaluation. (类别层次关系由如下论文提供 Chang, Dongliang, et al. “Your” Flamingo" is My" Bird": Fine-Grained, or Not." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.)
Stanford Cars contains 196 car models, which can be re-organised into 9 makers by tracing superclasses in Wikipedia pages (类别层次关系由如下论文提供 Chang, Dongliang, et al. “Your” Flamingo" is My" Bird": Fine-Grained, or Not." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.). The dataset contains 16,185 images, including 8,144 images for training and 8,041 images for testing.

Learning from Labels of Multi-granularity

[CVPR 2020] Making better mistakes: Leveraging class hierarchies with deep networks

[BMVC 2021] Leveraging Class Hierarchies with Metric-Guided Prototype Learning

[ICLR 2021] No cost likelihood manipulation at test time for making better mistakes in deep networks

[CVPR 2021] Your “Flamingo” is My “Bird”: Fine-Grained, or Not

[CVPR 2022] Label Relation Graphs Enhanced Hierarchical Residual Network for Hierarchical Multi-Granularity Classification

[CVPR 2022] Use All The Labels: A Hierarchical Multi-Label Contrastive Learning Framework

[ECCV 2022] Where to Focus: Investigating Hierarchical Attention Relationship for Fine-Grained Visual Classification

[ECCV 2022] Learning Hierarchy Aware Features for Reducing Mistake Severity

[ICLR 2023] Learning Structured Representations by Embedding Class Hierarchy

Learning Features from Parts

[CVPR 2017] Look Closer to See Better: Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition

[ECCV 2018] Learning to Navigate for Fine-grained Classification

[BMVC 2021] Feature fusion vision transformer for fine-grained visual categorization

[ACM MM 2021] Rams-trans: Recurrent attention multi-scale transformer for fine-grained image recognition

[AAAI 2022] TransFG: A Transformer Architecture for Fine-grained Recognition

paper: He, Ju, et al. “Transfg: A transformer architecture for fine-grained recognition.” Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 36. No. 1. 2022.
code: https://github.com/TACJu/TransFG
Warning: several open issues on Github are about reproducible problems and the authors did not respond actively… (About CUB-200-2011’s accuracy, About CUB ACC, About the training details)
blog: [AAAI 2022] TransFG: A Transformer Architecture for Fine-grained Recognition

[ACM MM 2022] SIM-Trans: Structure Information Modeling Transformer for fine-grained visual categorization

[Arxiv 2022] A Novel Plug-in Module for Fine-Grained Visual Classification

[CVPR 2022] Fine-Grained Object Classification via Self-Supervised Pose Alignment

[NeurIPS 2022] Relational Proxies: Emergent Relationships as Fine-Grained Discriminators

[TMM 2023] TransIFC: Invariant Cues-aware Feature Concentration Learning for Efficient Fine-grained Bird Image Classification

Learning multi-granularity features

[ECCV 2020] Fine-grained visual classification via progressive multi-granularity training of jigsaw patches

References

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Fine-Grained Visual Classification (FGVC)

Fine-Grained Visual Classification (FGVC)
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。