【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十）

最新推荐文章于 2024-07-19 15:15:22 发布

旅途中的宽~

最新推荐文章于 2024-07-19 15:15:22 发布

阅读量1.8k

点赞数

分类专栏：图像分类数据集文章标签：计算机视觉分类人工智能

本文链接：https://blog.csdn.net/wzk4869/article/details/133128035

版权

图像分类数据集专栏收录该内容

14 篇文章 14 订阅

订阅专栏

文章目录

一、ImageNet-9

ImageNet-9 由具有不同数量的背景和前景信号的图像组成，您可以使用它们来测量模型对图像背景的依赖程度。该数据集有助于测试视觉模型对图像背景的依赖性的鲁棒性。

二、KaoKore

由从前现代日本艺术品中提取的面孔组成。

三、Malaria Dataset

该数据集总共包含 27,558 个细胞图像，其中寄生细胞和未感染细胞的实例相同。

四、Red MiniImageNet 20% label noise

受控噪声网络标签数据集的一部分。

五、SI-SCORE (Synthetic Interventions on Scenes for Robustness Evaluation)

综合数据集用于对常见变异因素进行系统分析。

六、Tencent ML-Images

腾讯ML-Images是一个大型开源多标签图像数据库，包含17,609,752个训练图像URL和88,739个验证图像URL，注释了多达11,166个类别。

在这里插入图片描述

七、Urban Environments

城市环境数据集是包含 300 个欧洲城市的 20 个土地利用类别的数据集，并配有卫星图像数据。

在这里插入图片描述

八、DF20 (Danish Fungi 2020)

丹麦真菌 2020 (DF20) 是一个细粒度的数据集和基准。该数据集是根据提交给丹麦真菌图集的观察结果构建的，其独特之处在于分类准确的类标签、少量错误、高度不平衡的长尾类分布、丰富的观察元数据和明确定义的类层次结构。 DF20 与 ImageNet 零重叠，允许对从公开可用的 ImageNet 检查点微调的模型进行无偏差比较。

该数据集有 1,604 个不同的类别，有 248,466 个训练图像和 27,608 个测试图像。

在这里插入图片描述

九、DiagSet

DiagSet 是用于前列腺癌检测的组织病理学数据集。拟议的数据集由超过 260 万个组织斑块组成，这些组织斑块是从 430 个完全注释的扫描、4675 个指定二元诊断的扫描以及由一组组织病理学家独立给出诊断的 46 个扫描中提取的。

在这里插入图片描述

十、Food-101N

Food-101N 数据集在“CleanNet: Transfer Learning for Scalable Image Training with Label Noise (CVPR’18)”中介绍。它是一个图像数据集，包含约 310,009 个食物食谱图像，分为 101 个类别（类别）。Food-101N 和 Food-101 数据集共享相同的 101 个类别，而 Food-101N 具有更多图像且噪声更大。

Food-101N 专为以下两个任务而设计：1）学习带有标签噪声的图像分类2）标签噪声检测