【深度学习】15个目标检测开源数据集汇总

编辑丨极市平台

目标检测应当在这几年当中研究数量以及应用范围最广的一个领域,也持续的受到很多深度学习者们的关注。本文收集和整理了15个目标检测相关的开源数据集,希望能给大家的学习带来帮助。

汇总数据集免费下载链接:http://m6z.cn/5ZBLEU

数据集将会不断更新,欢迎大家持续关注!

1.火焰和烟雾图像数据集

数据集链接:http://m6z.cn/6fzn0f

该数据集由早期火灾和烟雾的图像数据集组成。数据集由在真实场景中使用手机拍摄的早期火灾和烟雾图像组成。大约有7000张图像数据。图像是在各种照明条件(室内和室外场景)、天气等条件下拍摄的。该数据集非常适合早期火灾和烟雾探测。数据集可用于火灾和烟雾识别、检测、早期火灾和烟雾、异常检测等。数据集还包括典型的家庭场景,如垃圾焚烧、纸塑焚烧、田间作物焚烧、家庭烹饪等。本文仅含100张左右。

693e1e980db278afa00492bfce69ef20.png

2.DOTA航拍图像数据集

DOTA是用于航空图像中目标检测的大型数据集。它可以用于开发和评估航空图像中的目标探测器。这些图像是从不同的传感器和平台收集的。每个图像的大小在800×800到20000×20000像素之间,包含显示各种比例、方向和形状的对象。DOTA图像中的实例由航空图像解释专家通过任意(8 d.o.f.)四边形进行注释。

480cc10a5634216591db16eb2d27a836.png

3. AITEX数据集

数据集链接:http://m6z.cn/5DdJL1

该数据库由七个不同织物结构的245张4096 x 256像素图像组成。数据库中有140个无缺陷图像,每种类型的织物20个,除此之外,有105幅纺织行业中常见的不同类型的织物缺陷(12种缺陷)图像。图像的大尺寸允许用户使用不同的窗口尺寸,从而增加了样本数量。

e15f1581af1e01f99ebb098eefaa2754.png

4. T-LESS数据集

数据集链接:http://m6z.cn/5wnucm

该数据集采集的目标为工业应用、纹理很少的目标,同时缺乏区别性的颜色,且目标具有对称性和互相关性,数据集由三个同步的传感器获得,一个结构光传感器,一个RGBD sensor,一个高分辨率RGBsensor,从每个传感器分别获得了3.9w训练集和1w测试集,此外为每个目标创建了2个3D model,一个是CAD手工制作的另一个是半自动重建的。训练集图片的背景大多是黑色的,而测试集的图片背景很多变,会包含不同光照、遮挡等等变换(之所以这么做作者说是为了使任务更具有挑战性)。

同时作者解释了本数据集的优势在于:1.大量跟工业相关的目标;2.训练集都是在可控的环境下抓取的;3.测试集有大量变换的视角;4.图片是由同步和校准的sensor抓取的;5.准确的6D pose标签;6.每个目标有两种3D模型;

7542144e34c861a80a3585c43747349d.png

5.H²O 行人交互检测数据集

数据集链接:http://m6z.cn/6fzmQf

H²O由V-COCO数据集中的10301张图像组成,其中添加了3635张图像,这些图像主要包含人与人之间的互动。所有的H²O图像都用一种新的动词分类法进行了注释,包括人与物和人与人之间的互动。该分类法由51个动词组成,分为5类:

  • 描述主语一般姿势的动词

  • 与主语移动方式有关的动词

  • 与宾语互动的动词

  • 描述人与人之间互动的动词

  • 涉及力量或暴力的互动动词

5f5a593951af4d27ab89c88eb974b50b.png

6.SpotGarbage垃圾识别数据集

数据集链接:http://m6z.cn/5ZMmRG

图像中的垃圾(GINI)数据集是SpotGarbage引入的一个数据集,包含2561张图像,956张图像包含垃圾,其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。

6d211877aea616fee0a8fb476c6c7279.png

7.NAO自然界对抗样本数据集

数据集链接:http://m6z.cn/5KJWJA

NAO包含7934张图像和9943个对象,这些图像未经修改,代表了真实世界的场景,但会导致最先进的检测模型以高置信度错误分类。与标准MSCOCO验证集相比,在NAO上评估时,EfficientDet-D7的平均精度(mAP)下降了74.5%。

e6bd3689d35cbbf2894b52fd16bec187.png

8.Labelme 图像数据集

数据集链接:http://m6z.cn/5Sg9NX

Labelme Dataset 是用于目标识别的图像数据集,涵盖 1000 多个完全注释和 2000 个部分注释的图像,其中部分注释图像可以被用于训练标记算法 ,测试集拥有来自于世界不同地方拍摄的图像,这可以保证图片在续联和测试之间会有较大的差异。该数据集由麻省理工学院 –计算机科学和人工智能实验室于 2007 年发布,相关论文有《LabelMe: a database and web-based tool for image annotation》。

6f936aa816a05097a4148af9f340ca1e.png

9.印度车辆数据集

数据集链接:http://m6z.cn/6uxAIx

该数据集包括小众印度车辆的图像,如Autorikshaw、Tempo、卡车等。该数据集由用于分类和目标检测的小众印度车辆图像组成。据观察,这些小众车辆(如autorickshaw、tempo、trucks等)上几乎没有可用的数据集。这些图像是在白天、晚上和晚上的不同天气条件下拍摄的。该数据集具有各种各样的照明、距离、视点等变化。该数据集代表了一组非常具有挑战性的利基类车辆图像。该数据集可用于驾驶员辅助系统、自动驾驶等的图像识别和目标检测。

ba517d44da5ce5eaa299fc361ce735ae.png

10.Seeing 3D chairs椅子检测模型

数据集链接:http://m6z.cn/5DdK0v

椅子数据集包含大约1000个不同三维椅子模型的渲染图像。

1491f44a99c11dba05439306c0777d23.png

11.SUN09场景理解数据集

数据集链接:http://m6z.cn/60wX8r

SUN09数据集包含12000个带注释的图像,其中包含200多个对象类别。它由自然、室内和室外图像组成。每个图像平均包含7个不同的注释对象,每个对象的平均占用率为图像大小的5%。对象类别的频率遵循幂律分布。发布者使用 397 个采样良好的类别进行场景识别,并以此搭配最先进的算法建立新的性能界限。

该数据集由普林斯顿视觉与机器人实验室于 2014 年发布,相关论文有《SUN Database: Large-scale Scene Recognition from Abbey to Zoo》、《SUN Database: Exploring a Large Collection of Scene Categories》。

bd0d38168f04875d5da8986c5e3fd331.png

12.Unsplash图片检索数据集

数据集链接:http://m6z.cn/5wnuoM

使用迄今为止公开共享的全球最大的开放检索信息数据集。Unsplash数据集由250000多名贡献摄影师创建,并包含了数十亿次照片搜索的信息和对应的照片信息。由于Unsplash数据集中包含广泛的意图和语义,它为研究和学习提供了新的机会。

037a4f365f7eccad73f1ca04511bd0bf.png

13.HICO-DET人物交互检测数据集

数据集链接:http://m6z.cn/5DdK6D

HICO-DET是一个用于检测图像中人-物交互(HOI)的数据集。它包含47776幅图像(列车组38118幅,测试组9658幅),600个HOI类别,由80个宾语类别和117个动词类别构成。HICO-DET提供了超过150k个带注释的人类对象对。V-COCO提供了10346张图像(2533张用于培训,2867张用于验证,4946张用于测试)和16199人的实例。

116e2c525149371c9225fd51d495d686.png

14.上海科技大学人群统计数据集

数据集链接:http://m6z.cn/5Sgafn

上海科技数据集是一个大规模的人群统计数据集。它由1198张带注释的群组图像组成。数据集分为两部分,A部分包含482张图像,B部分包含716张图像。A部分分为训练和测试子集,分别由300和182张图像组成。B部分分为400和316张图像组成的序列和测试子集。群组图像中的每个人都有一个靠近头部中心的点进行注释。总的来说,该数据集由33065名带注释的人组成。A部分的图像是从互联网上收集的,而B部分的图像是在上海繁忙的街道上收集的。

dc9fdfc29bc065c7026855aa15196f64.png

15.生活垃圾数据集

数据集链接:http://m6z.cn/6n5Adu

大约9000多张独特的图片。该数据集由印度国内常见垃圾对象的图像组成。图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。

565f2e787987ec3e8a8442a724b1ffa1.png


 

 

 

 

 
往期精彩回顾




适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑
AI基础下载机器学习交流qq群955171419,加入微信群请扫码:

f8c6fcb0250b6b5ebfca9aa5ae6bbe3a.png

<span style="color:#E53333;"><strong>告知:需要学习YOLOv4进行TT100K数据集上中国交通标志识别的学员请前往</strong></span><br /><br /><span style="color:#E53333;"><strong>(1) Ubuntu系统《YOLOv4目标检测实战:中国交通标志识别》课程链接:https://edu.csdn.net/course/detail/29362</strong></span> <p> <span style="color:#E53333;"><strong>(2)《Windows版YOLOv4目标检测实战:中国交通标志识别》</strong></span><span style="color:#E53333;"><strong>课程链接:https://edu.csdn.net/course/detail/29363</strong></span><span style="color:#E53333;"><strong></strong></span> </p> <br /> 在无人驾驶中,交通标志识别是一项重要的任务。本课程中的项目以<strong><span style="color:#E53333;">美国交通标志数据集LISA</span></strong>为训练对象,采用<strong><span style="color:#E53333;">YOLOv3</span></strong>目标检测方法实现实时交通标志识别。<br /><br /> 具体项目过程包括包括:安装Darknet、下载LISA交通标志数据集数据集格式转换、修改配置文件、训练LISA数据集、测试训练出的网络模型、性能统计(mAP计算和画出PR曲线)和先验框聚类。<br /><br /> YOLOv3基于深度学习,可以实时地进行端到端的目标检测,以速度快见长。本课程将手把手地教家使用YOLOv3实现交通标志的多目标检测。本课程的YOLOv3使用Darknet,在Ubuntu系统上做项目演示。 Darknet是使用C语言实现的轻型开源深度学习框架,依赖少,可移植性好,值得深入学习和探究。<br /><br /> 除本课程《YOLOv3目标检测实战:交通标志识别》外,本人推出了有关YOLOv3目标检测的系列课程,请持续关注该系列的其它课程视频,包括:<br /><br /> 《YOLOv3目标检测实战:训练自己的数据集》<br /><br /> 《YOLOv3目标检测:原理与源码解析》<br /><br /> 《YOLOv3目标检测:网络模型改进方法》<br /><br /> 另一门课程《YOLOv3目标检测实战:训练自己的数据集》主要是介绍如何训练自己标注的数据集。而本课程的区别主要在于学习对已标注数据集的格式转换,即把LISA数据集从csv格式转换成YOLOv3所需要的PASCAL VOC格式和YOLO格式。本课程提供数据集格式转换的Python代码。<br /><br /> 请家关注以上课程,并选择学习。<br /><br /> 下图是使用YOLOv3进行交通标志识别的测试结果<br /><p> <br /></p> <p> <img alt="" src="https://img-bss.csdn.net/201905291412089927.jpg" /><img alt="" src="https://img-bss.csdn.net/201905291412336785.jpg" /><img alt="" src="https://img-bss.csdn.net/201905291412485752.jpg" /></p> <p> <img alt="" src="https://img-bss.csdn.net/201905291413012686.jpg" /></p>
评论 1 您还未登录,请先 登录 后发表或查看评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:编程工作室 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值