【计算机视觉 | 图像分类】图像分类常用数据集及其介绍(六)

一、Visual Wake Words

视觉唤醒词代表了一种常见的微控制器视觉用例,用于识别图像中是否存在人,并为微小视觉模型提供了现实的基准。

在这里插入图片描述

二、ImageNet-P

ImageNet-P 由噪声、模糊、天气和数字失真组成。 数据集存在验证扰动; 有难度级别; 有 CIFAR-10、Tiny ImageNet、ImageNet 64 × 64、标准和 Inception 大小的版本; 并且是为基准测试而不是训练网络而设计的。 ImageNet-P 与 ImageNet-C 的不同之处在于,它从每个 ImageNet 验证图像生成扰动序列。 每个序列包含 30 多个帧,因此为了抵消数据集大小和评估时间的增加,仅使用 10 个常见扰动。

在这里插入图片描述

三、AI2D (AI2 Diagrams)

AI2 图 (AI2D) 是一个包含 5000 多个小学科学图表的数据集,其中包含超过 150000 个丰富的注释、其基本事实句法解析以及超过 15000 个相应的多项选择题。

在这里插入图片描述

四、FlickrLogos-32

用于徽标检测的对象检测基准。

图像是自然场景。 每张图片包含多个物体,每张图片总共有1个标志。 提供标志检测和分类标签。

在这里插入图片描述

五、ImageNet-64

Imagenet64 是一个由小图像组成的海量数据集,称为 Imagenet 的下采样版本。 Imagenet64 包含 1,281,167 个训练数据和 50,000 个测试数据以及 1,000 个标签。

在这里插入图片描述

六、OmniBenchmark

Omni-Realm Benchmark (OmniBenchmark) 是一个多样化(21 个语义领域数据集)且简洁(领域数据集没有概念重叠)的基准,用于评估跨语义超级概念/领域的预训练模型泛化,例如 从哺乳动物到飞机。

在这里插入图片描述

七、BAM! (Behance Artistic Media)

Behance 艺术媒体数据集 (BAM!) 是 Behance 的当代艺术作品的大型数据集,Behance 是一个包含来自专业和商业艺术家的数百万作品集的网站。 我们使用内容、情感和艺术媒体的丰富属性标签来注释 Behance 图像。 我们相信,对于希望研究艺术图像和相关问题的研究人员来说,我们的 Behance 艺术媒体数据集将是一个良好的起点。

数据集包括:

自动标记超过 250 万张图像的二元属性分数,每张图像包含 20 个属性
393,000 个针对单个图像的众包二进制属性标签
来自人群的 74,000 张图像的简短图像描述/标题

在这里插入图片描述

八、ImageNet-W (ImageNet-Watermark)

ImageNet-W(atermark) 是一个测试集,用于评估模型对 ImageNet 中新发现的水印快捷方式的依赖程度,该快捷方式用于预测纸箱类别。 ImageNet-W 是通过在 ImageNet 验证集上叠加透明水印而创建的。 使用两个指标来评估水印快捷方式依赖度:(1) IN-W Gap:从 ImageNet 到 ImageNet-W 的 top-1 精度下降,(2) Carton Gap:从 ImageNet 到 ImageNet-W 的纸箱类精度增加。 将 ImageNet-W 与之前的 ImageNet 的分布外变体(例如 Stylized ImageNet、ImageNet-R、ImageNet-9)相结合,形成了一套全面的 ImageNet 多捷径评估套件。

九、QMNIST

用于构建 MNIST 数据集的确切预处理步骤早已丢失。 这让我们没有可靠的方法将其角色与作者的 ID 关联起来,并且几乎没有希望恢复包含 60K 图像但从未发布的完整 MNIST 测试集。 官方 MNIST 测试集仅包含 10K 随机采样图像,通常被认为太小而无法提供有意义的置信区间。 QMNIST 数据集是根据 NIST 特殊数据库 19 中的原始数据生成的,目标是尽可能匹配 MNIST 预处理。 QMNIST 根据 BSD 风格许可证获得许可。

在这里插入图片描述

十、VizWiz-Classification

我们的目标是改善设计在一个领域训练的图像分类模型的现状,该模型在另一个领域的图像上表现良好。 为了补充鲁棒性测试中的现有工作,我们为此引入了第一个测试数据集,该数据集来自一个真实的用例,摄影师希望了解其图像中的内容。 我们使用盲人拍摄的 8,900 张图像构建了一个新的测试集,并收集了元数据来指示 200 个 ImageNet 对象类别的存在与否。 我们将此数据集称为 VizWiz-Classification。

在这里插入图片描述

十一、Imagenette

Imagenette 是 Imagenet 中 10 个易于分类的类的子集(长凳、英国弹跳器、录音机、链锯、教堂、圆号、垃圾车、加油站、高尔夫球、降落伞)。

在这里插入图片描述

十二、EyeQ

该数据集包含来自 EyePACS 数据集的 28,792 个视网膜图像,基于用于评估 RIQA 方法的三级质量分级系统(即“良好”、“可用”和“拒绝”)。

十三、LAG (Large-scale Attention based Glaucoma)

包括 5,824 张眼底图像,标记为阳性青光眼 (2,392) 或阴性青光眼 (3,432)。

十四、iNat2021 (iNaturalist 2021)

iNat2021 是由社区科学家收集和注释的大型图像数据集,包含来自 10k 不同物种的超过 270 万张图像。

为了使数据集更易于访问,作者还创建了一个“迷你”训练数据集,每个物种有 50 个示例,总共 50 万张图像。 每个物种有 10 个验证图像,总共 100k 个验证图像。 总共有500,000张测试图像。 除了整体规模外,iNat2021 的主要显着特点是每个物种的训练集中至少包含 152 张图像。

在这里插入图片描述

十五、LaMem

迄今为止的带注释的图像记忆数据集(包含来自不同来源的 60,000 张带标签的图像)。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值