基于matlab的语义分割_语义分割的数据集

背景

语义分割指的是把图像中的每个像素都划分到某一个类别上。

实现算法上,有传统时代的grab cut、ML时代的TextonForest、DL时代的FCN 、SegNet 、Dilated Convolutions 、DeepLab (v1 & v2)、RefineNet 、PSPNet 、Large Kernel Matters 、DeepLab v3等。当然了,现在是DL碾压的时代。

本文描述了DL时代的一些语义分割的数据集,由gemfield团队整理。

数据集

Stanford Background Dataset

该数据集包含从现有公共数据集中选择的715个图像,具有大约320×240像素,包含label种类:天空,树,道路,草,水,建筑物,山脉和前景物体。对于各类object的图像数,官网无描述?几百张左右。

Sift Flow Dataset

包含2688张图片,33个labels。

Awning(棚) balcony(阳台) bird(鸟) boat(船) bridge(桥)Building(建筑) bus(公交车) car(轿车) cow(牛) crosswalk(人行横道)Desert(沙漠) door(门) fence(篱笆) field grass(草地)Moon mountain person plant(植物) pole(杆)River(河) road rock(岩石) sand(沙) sea(海)Sidewalk(人行道) sign sky(天空) staircase(楼梯) streetlight(路灯)Sun treewindow

目测每一类都有百张左右,官网无描述?

Barcelona Dataset

building road sidewalk tree sky car wall person motorbike grass ground sea stand stair plant boat window bus door central rese bridge van fence trash crosswalk field sign umbrella bicycle truck sculpture poster balcony pole awning curb streetlight traffic light water column path head box blind bench bird handrail windshield wheel mountain parkingmete table text floor chair flag firehydrant pot lamp brand name roof dog headlight license plate bag tail light tower manhole paper air condition pipe chimney light face clock picture glass mirror leaf phone knob airplane animal apple basket bed book bookshelf bottle bowl branch brushes cabinet candle carpet cat ceiling cheetah closet cloud coffeemach cone counter top cpu crocodile cup curtain cushion deer dishwasher drawer duck elephant eye faucet fish flower foliage fork fridge frog furniture goat hand hippo jar keyboard knife land landscape laptop leopard lion lizard magazine mouse mousepad mug napkin object orange outlet painting pen pillow plate pumpkin river rock sand screen shelf sink snake snow socket sofa speaker spoon stove sun switch teapot television tiger towel vase wire worktop zebra

官网对每一类object的数量没有描述?

Coco数据集

COCO是一种大规模的物体检测,分割和字幕数据集。

330K张图片(>200K被标注) 150万个对象实例 80个object类别 91个stuff类别

MSRC Dataset (Microsoft Research in Cambridge)

MSRC Dataset V1:240个图像,可识别9个object class

Building grass tree cow horse sheep sky mountain aeroplane Water face car bicycle

请注意,在这个数据集中,没有足够的训练区域来学习马,水,山和绵羊的合理模型。

MSRC Dataset V2:591个图像,可识别23个object class:

Building grass tree cow horse sheep sky mountain Aeroplane water face car bicycle flower sign bird Book chair road cat dog body boat Horse和mountain样例不够,不建议考虑使用

医学上的,肝肿瘤

自动驾驶场景下的计算机视觉算法评测数据集

原始数据集被分类为’Road’, ’City’, ’Residential’, ’Campus’ 和 ’Person’。

PASCAL-Context

训练和验证集包含10,103张图像,测试集包含9,637张图像。与PASCAL VOC类别一样

Data from Games Database

数据集由24966个密集标记的框架组成,分为10个部分以方便使用。 类标签与CamVid和CityScapes数据集兼容。

HumanParsing-Dataset(人解析)

Background hat hair sunglass upper-clothes Skirt pants。。。

Multi-HumanParsing-Dataset V2包含25403张图片,每张图片上至少有两个人。

除background外,一共有58个类别。

LIP(Look Into Person)

LIP数据集中的人体图像是从microsoft coco训练集和验证集中裁剪的。定义了19个人体部件或衣服标签,它们是帽子、头发、太阳镜、上衣、衣服、外套、袜子、裤子、手套、围巾、裙子、连体裤、脸、右臂、左臂、右腿、左腿、右脚、右脚鞋、左鞋,以及背景标签。数据集中共有50462张图像,其中包括19081张全身图像、13672张上身图像、403张下身图像、3386张头部丢失的图像、2778张后视图图像和21028张有遮挡的图像。

25,000个高分辨率图像(分为18,000个用于训练,2,000个用于验证,5,000个用于测试)

152个物体类别,100个特定于实例的注释类别。一个多样化的街道级图像数据集,具有像素精确和特定于实例的人类注释,用于理解世界各地的街景。

Microsoft AirSim

自动驾驶平台

MIT场景解析基准(SceneParse150)为场景解析算法提供标准的训练和评估平台。 该基准测试的数据来自ADE20K数据集。

COCO 2017 Stuff Segmentation Challenge

COCO 2017 图像分割挑战赛

ADE20K

训练集:20210张 验证集:2000张

用于分割person,car and bike,每一类的图片数量参考官网。

Daimler Pedestrian Benchmark Data Sets

用于分析行人行为的数据集

EM图像中的神经元结构分割

human skin detection dataset 人类皮肤检测

FacePhoto:Total Images = 32

FamilyPhoto:Total Images = 46

分割(clothes)衣服

2,098张高分辨率街头时尚照片,共59个标签

航空影像图的分割

这些图像涵盖了不同的城市定居点,从人口密集的地区(例如旧金山的金融区)到高山城镇(例如,奥地利蒂罗尔的利恩茨),是对航拍图片中建筑物的分割。

ApolloScape

百度提供的场景解析数据集

开放数据集累计提供146,997帧图像数据,包含像素级标注和姿态信息,以及对应静态背景深度图像下载。

含有sky,共有34种objects

使用卫星图像和最近可用的3D高度数据产品来改进自动化建筑物检测的最新技术水平。

卫星图像中对建筑的分割,用于某比赛。

卫星图形中对道路网络的分割,用于某比赛。

数据集读取

语义分割的数据标注格式主要有以下几种:

1,COCO的RLE或者polygon(这个其实是实例分割,主要是COCO太重要了,所以列在这里)

2,png格式

png格式比较复杂,主流的代表有3种:P模式、grayscale模式、RGB模式;

2.1 P模式

Pascal VOC使用的是PIL的P模式,使用P模式将png图片读入:

>>> from PIL import Image

>>> im = Image.open('gemfield.png')

>>> type(im)

>>> im.mode

'P'

>>> im.ge

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值