camvid数据集介绍_语义分割的数据集

43b8950169216928835184d511d16659.png

背景

语义分割指的是把图像中的每个像素都划分到某一个类别上。

实现算法上,有传统时代的grab cut、ML时代的TextonForest、DL时代的FCN 、SegNet 、Dilated Convolutions 、DeepLab (v1 & v2)、RefineNet 、PSPNet 、Large Kernel Matters 、DeepLab v3等。当然了,现在是DL碾压的时代。

本文描述了DL时代的一些语义分割的数据集,由gemfield团队整理。

数据集

Stanford Background Dataset

该数据集包含从现有公共数据集中选择的715个图像,具有大约320×240像素,包含label种类:天空,树,道路,,建筑物,山脉和前景物体。对于各类object的图像数,官网无描述?几百张左右。

Sift Flow Dataset

包含2688张图片,33个labels。

Awning(棚) balcony(阳台) bird(鸟) boat(船) bridge(桥)Building(建筑) bus(公交车) car(轿车) cow(牛) crosswalk(人行横道)Desert(沙漠) door(门) fence(篱笆) field grass(草地)Moon mountain person plant(植物) pole(杆)River(河) road rock(岩石) sand(沙) sea(海)Sidewalk(人行道) sign sky(天空) staircase(楼梯) streetlight(路灯)Sun tree window

目测每一类都有百张左右,官网无描述?

Barcelona Dataset

building road sidewalk tree sky car wall person motorbike grass ground sea stand stair plant boat window bus door central rese bridge van fence trash crosswalk field sign umbrella bicycle truck sculpture poster balcony pole awning curb streetlight traffic light water column path head box blind bench bird handrail windshield wheel mountain parkingmete table text floor chair flag firehydrant pot lamp brand name roof dog headlight license plate bag tail light tower manhole paper air condition pipe chimney light face clock picture glass mirror leaf phone knob airplane animal apple basket bed book bookshelf bottle bowl branch brushes cabinet candle carpet cat ceiling cheetah closet cloud coffeemach cone counter top cpu crocodile cup curtain cushion deer dishwasher drawer duck elephant eye faucet fish flower foliage fork fridge frog furniture goat hand hippo jar keyboard knife land landscape laptop leopard lion lizard magazine mouse mousepad mug napkin object orange outlet painting pen pillow plate pumpkin river rock sand screen shelf sink snake snow socket sofa speaker spoon stove sun switch teapot television tiger towel vase wire worktop zebra

官网对每一类object的数量没有描述?

Coco数据集

COCO是一种大规模的物体检测,分割和字幕数据集。

330K张图片(>200K被标注) 150万个对象实例 80个object类别 91个stuff类别

MSRC Dataset (Microsoft Research in Cambridge

MSRC Dataset V1:240个图像,可识别9个object class

Building grass tree cow horse sheep sky mountain aeroplane Water face car bicycle

请注意,在这个数据集中,没有足够的训练区域来学习马,水,山和绵羊的合理模型。

MSRC Dataset V2:591个图像,可识别23个object class:

Building grass tree cow horse sheep sky mountain Aeroplane water face car bicycle flower sign bird Book chair road cat dog body boat Horse和mountain样例不够,不建议考虑使用

LITS Liver Tumor Segmentation Dataset

医学上的,肝肿瘤

KITTI

自动驾驶场景下的计算机视觉算法评测数据集

原始数据集被分类为’Road’, ’City’, ’Residential’, ’Campus’ 和 ’Person’。

PASCAL-Context

训练和验证集包含10,103张图像,测试集包含9,637张图像。与PASCAL VOC类别一样

共有400+ 个labels.个类别的的实例数见:https://cs.stanford.edu/~roozbeh/pascal-context/

Data from Games Database

数据集由24966个密集标记的框架组成,分为10个部分以方便使用。 类标签与CamVid和CityScapes数据集兼容。

HumanParsing-Dataset(人解析)

Background hat hair sunglass upper-clothes Skirt pants。。。

Multi-HumanParsing-Dataset V2包含25403张图片,每张图片上至少有两个人。

除background外,一共有58个类别。

官网上有对所有58个类别的例举:https://lv-mhp.github.io/dataset

LIP(Look Into Person)

LIP数据集中的人体图像是从microsoft coco训练集和验证集中裁剪的。定义了19个人体部件或衣服标签,它们是帽子、头发、太阳镜、上衣、衣服、外套、袜子、裤子、手套、围巾、裙子、连体裤、脸、右臂、左臂、右腿、左腿、右脚、右脚鞋、左鞋,以及背景标签。数据集中共有50462张图像,其中包括19081张全身图像、13672张上身图像、403张下身图像、3386张头部丢失的图像、2778张后视图图像和21028张有遮挡的图像。

Mapillary Vistas Dataset(远景数据集)

25,000个高分辨率图像(分为18,000个用于训练,2,000个用于验证,5,000个用于测试)

152个物体类别,100个特定于实例的注释类别。一个多样化的街道级图像数据集,具有像素精确和特定于实例的人类注释,用于理解世界各地的街景。

Microsoft AirSim

自动驾驶平台

MIT Scene Parsing Benchmark

MIT场景解析基准(SceneParse150)为场景解析算法提供标准的训练和评估平台。 该基准测试的数据来自ADE20K数据集。

COCO 2017 Stuff Segmentation Challenge

COCO 2017 图像分割挑战赛

ADE20K

训练集:20210张 验证集:2000张

含有天空,水,草地。官网上列出了所有实例数超过250的objects:http://groups.cs

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: CamVid数据集是一个流行的计算机视觉数据集,用于语义分割和场景理解的深度学习模型训练和测试。该数据集包含601个高分辨率的图像和相应的像素级别标签。这些图像涵盖了城市和乡村地区的不同场景,例如街道、广场、草地、标志和建筑物。该数据集已广泛用于自动驾驶、智能交通、遥感图像解释等领域研究。 ### 回答2: CamVid是一个用于图像分割任务的常用数据集,它由剑桥大学计算机实验室与英国高速铁路公司合作创建。该数据集由训练集、验证集和测试集组成,共包含701个图像以及和每个图像对应的标签。 CamVid数据集中的图像是在剑桥市的城市街道上采集的,包括各种环境、天气和道路状况。这些图像通过一辆装备有摄像头和GPS设备的汽车进行采集,车辆随着交通流量在城市不同区域行驶。图像的分辨率为960×720像素,以JPEG格式存储。 每个图像都有对应的像素级标签,标注了图像中每个像素所属的类别。CamVid数据集中共包含32个类别,涵盖了道路、建筑物、行人、车辆等常见类别。这些标签以颜色编码的形式呈现,方便可视化地观察每个类别。 CamVid数据集在计算机视觉和机器学习领域应用广泛,例如图像分割、语义分割、目标识别等任务。由于数据集涵盖了复杂的城市场景,对算法的鲁棒性和泛化能力提出了很高的要求。因此,研究人员常常利用CamVid数据集进行算法评估和性能比较,以提升模型的准确率和鲁棒性。 总之,CamVid是一个常用的图像分割数据集,包含了701个道路场景图像和对应的像素级标签。它为研究人员提供了一个用于评估和比较算法性能的基准,对于城市场景下的图像分割任务具有重要的研究价值。 ### 回答3: CamVidCambridge-Driving Labeled Video Database)是由剑桥大学的研究团队创建的一个计算机视觉数据集,用于语义分割任务。该数据集是基于驾驶视频数据进行标记,旨在训练和评估模型在道路场景中进行像素级别的物体分类和分割。 CamVid数据集包含701个视频序列,每个序列大约为10秒,由一个车载摄像头记录。这些视频序列包含有关城市道路交通的各种复杂场景,如交叉口、人行道、自行车道和停车场等。 这些视频序列由32个不同的类别组成,包括车辆、行人、自行车、道路、建筑物等。每个像素都被标记为相应的类别,以帮助模型学习正确的像素分类CamVid数据集还提供了一个相应的标签图像,与原始图像大小相同。这些标签图像使用彩色编码表示不同的类别,使得像素之间的关系更易于理解和解读。 此外,CamVid数据集还提供了训练、验证和测试集划分,以便开发者可以在不同的数据子集上训练和评估他们的模型。 CamVid数据集由于其真实的道路场景和详细的像素级标注,成为语义分割模型的重要基准之一。它广泛被用于训练和评估计算机视觉算法和模型,特别是在自动驾驶、智能交通和城市规划领域。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值