遇到的各种比赛和数据集

目录

比赛

IMDB

ImageNet

PASCAL VOC

MNIST

CIFAR

COCO

CoNLL2000

Caltech

KITTI (Karlsruhe Institute ofTechnology and Toyota Technological Institute)

Open Images V5

VisDrone2020

皮肤数据集


比赛

Kaggle

ILSVRC:ImageNet Large Scale Visual Recognition Challenge

IMDB

互联网电影数据库

ImageNet

ImageNet是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。能够从图片识别物体。目前已经包含14197122张图像,是已知的最大的图像数据库。

下载链接为

http://www.image-net.org/

PASCAL VOC

PASCAL VOC 数据集是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。包含VOC2007(430M),VOC2012(1.9G)两个下载版本。

下载链接为

http://pjreddie.com/projects/pascal-voc-dataset-mirror/

MNIST

手写数字数据集

CIFAR

物体分类数据集,包括CIFAR-10和CIFAR-100

COCO

COCO是一种新的图像识别,分割和加字幕标注的数据集。

其主要特征如下

(1)目标分割

(2)通过上下文进行识别

(3)每个图像包含多个目标对象

(4)超过300000个图像

(5)超过2000000个实例

(6)80种对象

(7)每个图像包含5个字幕

(8)包含100000个人的关键点

CoNLL2000

语料库包含 27 万词的《华尔街日报文本》,分为“训练”和“测试”两部分,标注有词性标记和 IOB 格式词块标记。

Caltech

Caltech是加州理工学院的图像数据库,包含Caltech101和Caltech256两个数据集。Caltech101包含101种类别的物体,每种类别大约40到800个图像,大部分的类别有大约50个图像。Caltech256包含256种类别的物体,大约30607张图像。

下载链接为

http://www.vision.caltech.edu/Image_Datasets/Caltech101/

KITTI (Karlsruhe Institute ofTechnology and Toyota Technological Institute)

KITTI包含7481个训练图片和7518个测试图片。所有图片都是真彩色png格式。该数据集中标注了车辆的类型,是否截断,遮挡情况,角度值,2维和3维box框,位置,旋转角度,分数等重要的信息,绝对是做车载导航的不可多得的数据集。

下载链接为

http://www.cvlibs.net/datasets/kitti/

Open Images V5

Open Images是一个由~9M图像组成的数据集,使用图像级标签( image-level labels)、对象边界框(object bounding boxes)、对象分割掩码(object segmentation masks)和视觉关系(visual relationships)进行注释。它总共包含16M个边界框,用于190万(1.9M)张图像上的600个对象类,使其成为现有最大的带有对象位置注释(object location annotations)的数据集。这些方框主要由专业注释人员手工绘制,以确保准确性(accuracy )和一致性(consistency)。图像非常多样化,通常包含多个对象的复杂场景(平均每张图像8.3个对象)。Open Images还提供了可视化的关系注释,指示特定关系中的对象对(例如,“弹吉他的女人”、“桌子上的啤酒”)。共有三胞胎329对,其中三胞胎391,073例(In total it has 329 relationship triplets with 391,073 samples.)。在V5中,我们为350个类中的280万个对象实例添加了分割掩码。分割掩模标记对象的轮廓,它将对象的空间范围描述得更加详细。最后,使用 36.5M 图像级标签(image-level labels)对数据集进行注释,这些标签跨越19,969个类。

VisDrone2020

The VisDrone2020 dataset is collected by the AISKYEYE team at Lab of Machine Learning and Data Mining , Tianjin University, China. The benchmark dataset consists of 400 video clips formed by 265,228 frames and 10,209 static images, captured by various drone-mounted cameras, covering a wide range of aspects including location (taken from 14 different cities separated by thousands of kilometers in China), environment (urban and country), objects (pedestrian, vehicles, bicycles, etc.), and density (sparse and crowded scenes). Note that, the dataset was collected using various drone platforms (i.e., drones with different models), in different scenarios, and under various weather and lighting conditions. These frames are manually annotated with more than 2.6 million bounding boxes or points of targets of frequent interests, such as pedestrians, cars, bicycles, and tricycles. Some important attributes including scene visibility, object class and occlusion, are also provided for better data utilization.

皮肤数据集

The International Skin Imaging Collaboration (ISIC) Archive, https://isic-archive.com/

Steve Thomas, “Medetec wound database, http://www.medetec.co.uk/files/medetec-image-databases.html,” 2017.

A cognitive prosthesis to aid focal skin lesion diagnosis. URL https://homepages.inf.ed.ac.uk/rbf/DERMOFIT/

https://www.dermnetnz.org

https://www.shutterstock.com/zh/search/skin+bruising

http://www.dermoscopyatlas.com

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值