深度学习各方向数据集资源大全

chong墩儿

已于 2024-01-20 20:31:02 修改

阅读量810

点赞数 2

文章标签：深度学习人工智能

于 2024-01-20 20:29:49 首次发布

原文链接：https://mp.weixin.qq.com/s/SU-ZzSWzVNQRrxFJx8C3yA

版权

原文链接：https://mp.weixin.qq.com/s/SU-ZzSWzVNQRrxFJx8C3yA
原创：极市平台

本文汇总了图像增强/分割/识别/检测、工业检测、医学图像、目标跟踪、异常检测等方向数据集资源，均附有下载链接 >>
持续更新，支持跳转原文查询全部

数据集列表

一、图像增强

1、对比度增强评估数据库（CEED2016）

数据集下载地址：http://suo.nz/2JfsSf

该CEED2016是新开发的图像数据库，专门用于对比度增强评估。该数据库包含 30 张原始彩色图像和 180 张使用六种不同 CE 方法获得的增强图像。

2、NILUT三维LUT数据集

数据集下载地址：http://suo.nz/2QLFVk

3、内窥镜真实图像

数据集下载地址：http://suo.nz/2YdgQ5

在内窥镜检查中，由于中空器官内壁的光反射而出现曝光误差是很常见的。例如，当内窥镜的尖端（有光）指向褶皱时，这些结构会反射光线，引起过度曝光，而镜框另一端可能会出现曝光不足的区域。目前，增强曝光误差的方法需要配对数据，即损坏的帧及其各自的地面实况（即未损坏或干净的图像）。例如，对于自然图像，已经提出了包含常见现实生活图像的LOL或MIT-Adobe FiveK数据集。这些配对数据集允许研究人员利用标准化的地面实况图像来训练和评估他们的模型。我们的工作旨在通过使用GANs创建一个没有任何曝光误差的真实图像和具有曝光误差的相同图像的配对数据集。

4、真实世界模糊图像数据集

下载链接：http://suo.nz/2nk7w2

训练集：182 个不同场景的 3,758 个图像对。测试集：50 个不同场景的 980 个图像对。

5、I-HAZE图像去雾数据集

下载链接：http://suo.nz/2fNUrl

该数据集中包含 35 个有雾图像对和相应的无雾（地面实况）室内图像。与大多数现有的去雾数据库不同，雾霾图像是使用专业雾霾机产生的真实雾霾生成的。为了简化颜色校准并改进去雾算法的评估，每个场景都包含一个 MacBeth 颜色检查器。此外，由于图像是在受控环境中捕获的，因此无雾和有雾图像都是在相同的照明条件下捕获的。

6、UIEB水下图像增强数据集

下载链接：http://suo.nz/3dY13O

该数据集包括 950 张真实水下图像，其中 890 张具有相应的参考图像。并将其余60幅无法获得满意参考图像的水下图像视为具有挑战性的数据。

7、GoPro去模糊数据集

下载链接：http://suo.nz/36rNZ7

用于去模糊的 GoPro 数据集由 3,214 张模糊图像组成，大小为 1,280×720，分为 2,103 张训练图像和 1,111 张测试图像。该数据集由成对的真实模糊图像和高速摄像机获得的相应地面实况图像组成。

8、NH-HAZE

下载地址：http://m6z.cn/5tyN0D

这是一个非均匀的真实数据集，具有成对的真实雾度和相应的无雾度图像。这是第一个非齐次图像去模糊数据集，包含55个室外场景。在场景中引入了非均匀雾，使用专业雾发生器模拟雾场景的真实条件。

9、ExDark图像数据集

下载地址：http://suo.nz/2lidoI

Exclusively Dark (ExDARK) 数据集是 7,363 张从极低光环境到黄昏（即 10 种不同条件）的低光图像的集合，具有 12 个对象类（类似于 PASCAL VOC），在图像类级别和局部对象边界上进行了注释盒子。

10、WoodScape自动驾驶鱼眼数据集

下载地址：http://suo.nz/2HMEtL

WoodScape 包含四个环视摄像头和九项任务，包括分割、深度估计、3D 边界框检测和新型污染检测。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。

11、PolyU数据集

数据集下载地址：https://sourl.cn/rMsdE8

大多数以前的图像去噪方法都集中在加性高斯白噪声（AWGN）上。然而，随着计算机视觉技术的进步，现实世界中的噪声图像去噪问题也随之而来。为了在实现并发真实世界图像去噪数据集的同时促进对该问题的研究，作者们构建了一个新的基准数据集，其中包含不同自然场景的综合真实世界噪声图像。这些图像是由不同的相机在不同的相机设置下拍摄的。

二、实例分割

1、细胞实例分割数据集

数据集下载链接：http://suo.nz/3bokV6

引入了新的大型细胞实例分割数据集（CISD）。它包括3911个样品，其中包含至少两个接触或重叠的尿路上皮细胞。细胞实例由训练有素的细胞技术人员手动注释。所有样品均从 30 张数字细胞学载玻片中提取，这些载玻片用 9 种不同的 Papanicolaou 染色染色。细胞学载玻片使用豪洛捷 ThinPrep®5000 处理器从健康患者的尿液样本中制备，并常规使用安捷伦 Dako 盖染色仪®进行染色。最终使用具有21个焦平面的Hamamatsu NanoZoomer®S360对载玻片进行数字化，并以扫描仪自动对焦确定的最佳焦平面为中心。

2、非模态实例分割数据集

数据集下载链接：http://suo.nz/33S7Qp

这是遥感领域的非模态实例分割数据集。数据集目前仅包含 9 张图片，其余 1000+ 张图片将在稍后发布。屋顶、建筑物和遮挡类别在数据集中进行了标记，分别表示建筑物的屋顶、建筑物的整个区域和建筑物的遮挡部分。

3、Embrapa酿酒葡萄实例分割数据集

数据集下载链接：http://suo.nz/337vkW

本数据集用于研究葡萄栽培中基于图像的监测和现场机器人的对象检测和实例分割。它提供了在田间采集的五种不同葡萄品种的实例。这些实例显示了葡萄姿势、光照和焦点的差异，包括遗传和物候变化，如形状、颜色和紧凑度。

4、树上芒果实例分割数据集

数据集下载链接：http://suo.nz/2VBigf

使用带有多边形区域注释的VGG图像注释工具（Dutta & Zisserman 2019）对图像进行注释。两个文件夹包含用于训练和文本图像集的 COCO 注释格式的图像和 JSON 注释文件。

5、实例分割计算机视觉项目

数据集下载链接：http://suo.nz/2O5vcs

以下是此项目的一些用例：

1.杂货库存管理：洋葱检测器可用于超市和杂货店，通过准确识别和计数存储区域或展示架上的洋葱，自动监控和管理洋葱的库存和库存。

2.洋葱收获自动化：使用洋葱检测器模型开发收获自动化设备可以帮助农民和农业公司检测和分离除草植物或土壤中的洋葱，显着提高洋葱收获过程的速度和效率。

3.食品工业质量控制：洋葱检测仪可以集成到食品加工厂的生产线中，使系统能够自动检测各个加工阶段的洋葱 - 例如分类，清洁和分级 - 以确保最终产品的质量一致。

4.减少洋葱浪费：该模型可用于零售、餐厅或家庭环境，以识别可能开始变质的洋葱，使消费者或餐饮服务经营者能够在需要丢弃之前优先使用这些洋葱，最终限制食物浪费。

5.智能厨房辅助：通过将洋葱检测器集成到智能厨房电器中，用户可以根据可用成分（包括洋葱）接收自动食谱建议，从而更轻松地确定膳食选项，而无需手动搜索食谱数据库。

三、目标跟踪

1、用于低空交通监控的多模态无人机数据集

数据集下载链接：http://suo.nz/2RX507

AU-AIR 数据集是第一个用于目标检测的多模态无人机数据集。

AU-AIR具有以下几个特点：

航空图像中的物体检测
大于2 小时原始视频
32,823 个标记帧
132,034 个对象实例
与交通监控相关的8个对象类别
帧上还标注了无人机的时间、GPS、IMU、高度、线速度

2、KITTI目标跟踪

数据集下载链接：http://suo.nz/2KqSby

3、ALOV300++跟踪数据集

数据集下载链接：http://suo.nz/2dKDTl

ALOV++，Amsterdam Library of Ordinary Videos for tracking 是一个物体追踪视频数据，旨在对不同的光线、通透度、泛着条件、背景杂乱程度、焦距下的相似物体的追踪。

4、PathTrack 数据集

数据集下载链接：http://suo.nz/2OFhXy

用于多目标跟踪 (MOT)。PathTrack 数据集包含 720 个视频序列中的 15,000 多个人的轨迹。

5、VOT2020

数据集下载链接：http://suo.nz/2W7iD5

6、NfS高帧率视频数据集

数据集下载链接：http://suo.nz/34o8df

第一个更高帧率的视频数据集（称为极品飞车 - NfS）和视觉对象跟踪基准。该数据集包含 100 个视频（380K 帧），这些视频是使用现在常见的更高帧率 (240 FPS) 摄像机从现实世界场景中捕获的。所有帧都用轴对齐的边界框进行注释，所有序列都用九个视觉属性手动标记——例如遮挡、快速运动、背景杂乱等。

7、Temple Color 128

Temple Color 128 数据集下载链接：http://suo.nz/2dKEEL

本数据集包含一大组 128 种颜色序列，带有基本事实和挑战因素注释（例如，遮挡）

四、少样本/零样本学习

1、FSOD少样本目标检测数据集

数据集下载链接：http://suo.nz/3d6H0E

少样本目标检测数据集（FSOD）是一个高度多样化的数据集，专门为少样本目标检测而设计，本质上是为了评估模型在新类别上的通用性。

2、UT Zappos50K鞋类数据集

数据集下载链接：http://suo.nz/35EG4Z

UT Zappos50K ( UT-Zap50K ) 是一个大型鞋类数据集，包含从Zappos.com收集的50,025 个目录图像。这些图像分为 4 个主要类别——鞋子、凉鞋、拖鞋和靴子——其次是功能类型和个人品牌。鞋子以白色背景为中心，并以相同方向进行拍照，以便于分析。

3、Animals with Attributes数据集

数据集下载链接：http://suo.nz/2Y8tgq

该数据集提供了一个基准迁移学习算法的平台，特别是属性基分类和零样本学习[1]。它可以作为原始Animals with Attributes (AwA)数据集 [2,3]的直接替代品，因为它具有相同的类结构和几乎相同的特征。它由 50 个动物类别的 37322 张图像组成，每张图像都有预先提取的特征表示。这些类与 Osherson 的经典类/属性矩阵 [3,4] 对齐，从而为每个类提供 85 个数字属性值。使用共享属性，可以在不同类之间传输信息。

4、原始矿物物种识别基准

数据集下载链接：http://suo.nz/2RidE3

该数据集包含 5,000 多种不同的矿物物种，并包含零样本和少样本学习的子集。除了样本本身之外，数据集中的一些条目还附有补充的自然语言描述、大小测量和分割掩码。

在这里插入图片描述

5、RareAct异常动作视频数据集

数据集下载链接：http://suo.nz/2JM0zm

RareAct是一个异常动作的视频数据集，包括“混合手机”、“切键盘”和“微波炉鞋”等动作。它的目的是评估动作识别模型的零样本和少样本组合性，以识别常见动作动词和宾语名词的不太可能的组合。它包含 122 个不同的动作，这些动作是通过组合在 HowTo100M 的大规模文本语料库中很少同时出现但经常单独出现的动词和名词来获得的。

6、Generix 对象零样本学习 ( GOZ ) 数据集

数据集下载链接：http://suo.nz/2J1o3T

Generix 对象零样本学习 ( GOZ ) 数据集是零样本学习的基准数据集。

五、异常检测

1、AeBAD航空发动机叶片异常检测数据集

数据集下载链接：http://suo.nz/2IU48P

真实世界的航空发动机叶片异常检测（AeBAD）数据集，由两个子数据集组成：单叶片数据集（AeBAD-S）和叶片视频异常检测数据集（AeBAD-V）。与现有数据集相比，AeBAD具有以下两个特点：1.）目标样本未对齐且处于不同的尺度。2.) 测试集和训练集中正态样本的分布存在域偏移，其中域偏移主要是由光照和视图的变化引起的。

2、BeanTech 异常检测数据集

数据集下载链接：http://suo.nz/2JEGEi

BTAD （beanTech 异常检测）数据集是真实世界的工业异常数据集。该数据集包含 3 种工业产品的总共 2830 张真实世界图像。

3、LAD视频序列异常检测

数据集下载链接：http://suo.nz/35AL1Z

Large-scale Anomaly Detection (LAD) 是一个用于对视频序列中的异常检测进行基准测试的数据库，它具有两个方面的特点。1) 包含正常和异常视频片段2000个视频序列，碰撞、火灾、暴力等14个异常类别，场景种类繁多，是目前最大的异常分析数据库。2）提供标注数据，包括视频级标签（异常/正常视频、异常类型）和帧级标签（异常/正常视频帧），方便异常检测。

4、RoadAnomaly21

数据集下载链接：http://suo.nz/2Y8MHC

RoadAnomaly21是一个用于异常分割的数据集，其任务是识别包含训练期间从未见过的对象的图像区域。它由 100 张带有像素级注释的图像的评估数据集组成。每张图片至少包含一个异常物体，例如动物或未知车辆。异常可以出现在图像的任何地方，并且大小差异很大，覆盖图像的 0.5% 到 40%。

5、UBnormal数据集

数据集下载链接：http://suo.nz/2Rix5f

UBnormal 是一种新的监督开放集基准测试，由多个虚拟场景组成，用于视频异常检测。与现有数据集不同，该数据集在训练时引入了像素级注释的异常事件，首次实现了使用全监督学习方法进行异常事件检测。为了保留典型的开放集公式，数据集在视频的训练和测试集合中包含不相交的异常类型集。

6、VisA异常数据集

数据集下载链接：http://suo.nz/2JMk0y

VisA 数据集包含 12 个子集，对应 12 个不同的对象。共有 10,821 张图像，其中包含 9,621 个正常样本和 1,200 个异常样本。四个子集是不同类型的印刷电路板 (PCB)，具有相对复杂的结构，包括晶体管、电容器、芯片等。对于视图中多个实例的情况，我们收集了四个子集：Capsules、Candles、Macaroni1 和 Macaroni2。Capsules 和 Macaroni2 中的实例在位置和姿势上有很大不同。

六、医学影像

1、CT 医学图像

下载链接：http://suo.nz/2tQehH

该数据集旨在允许测试不同的方法来检查与使用对比度和患者年龄相关的 CT 图像数据的趋势。基本思想是识别与这些特征密切相关的图像纹理、统计模式和特征，并可能构建简单的工具，在这些图像被错误分类时自动对其进行分类（或查找可能是可疑情况、错误测量或校准不良机器的异常值）

2、MedMNIST医学图像分割评估

下载链接：http://suo.nz/2Bmrmo

MedMNIST，这是 10 个预处理的医学开放数据集的集合。MedMNIST 经过标准化处理，可在轻量级 28x28 图像上执行分类任务，无需背景知识。它涵盖了医学图像分析中的主要数据模式，在数据规模（从 100 到 100,000）和任务（二元/多类、序数回归和多标签）上具有多样性。MedMNIST 可用于教育目的、快速原型设计、多模式机器学习或医学图像分析中的 AutoML。此外，MedMNIST Classification Decathlon 旨在对所有 10 个数据集上的 AutoML 算法进行基准测试

2、多标签视网膜疾病 (MuReD) 数据集

下载链接：http://suo.nz/2ISEr5

多标签视网膜疾病（MuReD）数据集，使用从三个不同的最先进来源（即 ARIA、STARE 和 RFMiD 数据集）收集的图像，并执行一系列后处理确保图像质量的处理步骤、要分类的广泛疾病以及每个疾病标签有足够数量的样本。MuReD 数据集由 2208 张图像组成，具有 20 个不同的标签，图像质量和分辨率各不相同。同时，确保数据的最低质量，每个标签有足够数量的样本。

3、疟疾细胞图像数据集

下载链接：http://suo.nz/2VQTUt

4、皮肤癌 MNIST：HAM10000

下载链接：http://suo.nz/33n6Xy

该数据集收集了来自不同人群的皮肤镜图像，通过不同的方式获取和存储。最终数据集包含 10015 张皮肤镜图像，可用作学术机器学习目的的训练集。案例包括色素病变领域所有重要诊断类别的代表性集合：光化性角化病和上皮内癌/鲍温氏病 (akiec)、基底细胞癌 (bcc)，超过50%的病变是通过组织病理学（histo）证实的，其余病例的ground truth要么是后续检查（follow_up），要么是专家共识（consensus），要么是活体共聚焦显微镜（confocal）证实. 数据集包括具有多个图像的病变，可以通过 HAM10000_metadata 文件中的 lesion_id 列进行跟踪。

5、乳房组织病理学图像

下载链接：http://suo.nz/347Jt1

原始数据集包含以 40 倍扫描的 162 个完整的乳腺癌 (BCa) 标本幻灯片图像。从中提取了 277,524 个大小为 50 x 50 的补丁（198,738 个 IDC 负值和 78,786 个 IDC 正值）。每个补丁的文件名格式为：u_xX_yY_classC.png — > example 10253_idx5_x1351_y1101_class0.png。其中 u 是患者 ID (10253_idx5)，X 是裁剪此补丁的 x 坐标，Y 是裁剪此补丁的 y 坐标，C 表示类，其中 0 是非 IDC 和1 是数据中心。