基于matlab的语义分割_语义分割的数据集

最新推荐文章于 2023-01-02 17:44:59 发布

weixin_39584405

最新推荐文章于 2023-01-02 17:44:59 发布

阅读量1.6k

点赞数

文章标签：基于matlab的语义分割

本文链接：https://blog.csdn.net/weixin_39584405/article/details/111838910

版权

背景

语义分割指的是把图像中的每个像素都划分到某一个类别上。

实现算法上，有传统时代的grab cut、ML时代的TextonForest、DL时代的FCN 、SegNet 、Dilated Convolutions 、DeepLab (v1 & v2)、RefineNet 、PSPNet 、Large Kernel Matters 、DeepLab v3等。当然了，现在是DL碾压的时代。

本文描述了DL时代的一些语义分割的数据集，由gemfield团队整理。

数据集

Stanford Background Dataset

该数据集包含从现有公共数据集中选择的715个图像，具有大约320×240像素，包含label种类：天空，树，道路，草，水，建筑物，山脉和前景物体。对于各类object的图像数，官网无描述？几百张左右。

Sift Flow Dataset

包含2688张图片，33个labels。

Awning(棚) balcony(阳台) bird(鸟) boat(船) bridge(桥)Building(建筑) bus(公交车) car(轿车) cow(牛) crosswalk(人行横道)Desert(沙漠) door(门) fence(篱笆) field grass(草地)Moon mountain person plant(植物) pole(杆)River(河) road rock(岩石) sand(沙) sea(海)Sidewalk(人行道) sign sky(天空) staircase(楼梯) streetlight(路灯)Sun treewindow

目测每一类都有百张左右，官网无描述？

Barcelona Dataset

building road sidewalk tree sky car wall person motorbike grass ground sea stand stair plant boat window bus door central rese bridge van fence trash crosswalk field sign umbrella bicycle truck sculpture poster balcony pole awning curb streetlight traffic light water column path head box blind bench bird handrail windshield wheel mountain parkingmete table text floor chair flag firehydrant pot lamp brand name roof dog headlight license plate bag tail light tower manhole paper air condition pipe chimney light face clock picture glass mirror leaf phone knob airplane animal apple basket bed book bookshelf bottle bowl branch brushes cabinet candle carpet cat ceiling cheetah closet cloud coffeemach cone counter top cpu crocodile cup curtain cushion deer dishwasher drawer duck elephant eye faucet fish flower foliage fork fridge frog furniture goat hand hippo jar keyboard knife land landscape laptop leopard lion lizard magazine mouse mousepad mug napkin object orange outlet painting pen pillow plate pumpkin river rock sand screen shelf sink snake snow socket sofa speaker spoon stove sun switch teapot television tiger towel vase wire worktop zebra

官网对每一类object的数量没有描述？

Coco数据集

COCO是一种大规模的物体检测，分割和字幕数据集。

330K张图片(>200K被标注) 150万个对象实例 80个object类别 91个stuff类别

MSRC Dataset (Microsoft Research in Cambridge)

MSRC Dataset V1：240个图像，可识别9个object class

Building grass tree cow horse sheep sky mountain aeroplane Water face car bicycle

请注意，在这个数据集中，没有足够的训练区域来学习马，水，山和绵羊的合理模型。

MSRC Dataset V2：591个图像，可识别23个object class：

Building grass tree cow horse sheep sky mountain Aeroplane water face car bicycle flower sign bird Book chair road cat dog body boat Horse和mountain样例不够，不建议考虑使用

医学上的，肝肿瘤

自动驾驶场景下的计算机视觉算法评测数据集

原始数据集被分类为’Road’, ’City’, ’Residential’, ’Campus’ 和 ’Person’。

PASCAL-Context

训练和验证集包含10,103张图像，测试集包含9,637张图像。与PASCAL VOC类别一样

Data from Games Database

数据集由24966个密集标记的框架组成，分为10个部分以方便使用。类标签与CamVid和CityScapes数据集兼容。

HumanParsing-Dataset(人解析)

Background hat hair sunglass upper-clothes Skirt pants。。。

Multi-HumanParsing-Dataset V2包含25403张图片，每张图片上至少有两个人。

除background外，一共有58个类别。

LIP(Look Into Person)

LIP数据集中的人体图像是从microsoft coco训练集和验证集中裁剪的。定义了19个人体部件或衣服标签，它们是帽子、头发、太阳镜、上衣、衣服、外套、袜子、裤子、手套、围巾、裙子、连体裤、脸、右臂、左臂、右腿、左腿、右脚、右脚鞋、左鞋，以及背景标签。数据集中共有50462张图像，其中包括19081张全身图像、13672张上身图像、403张下身图像、3386张头部丢失的图像、2778张后视图图像和21028张有遮挡的图像。

25,000个高分辨率图像(分为18,000个用于训练，2,000个用于验证，5,000个用于测试)

152个物体类别，100个特定于实例的注释类别。一个多样化的街道级图像数据集，具有像素精确和特定于实例的人类注释，用于理解世界各地的街景。

Microsoft AirSim

自动驾驶平台

MIT场景解析基准(SceneParse150)为场景解析算法提供标准的训练和评估平台。该基准测试的数据来自ADE20K数据集。

COCO 2017 Stuff Segmentation Challenge

COCO 2017 图像分割挑战赛

ADE20K

训练集：20210张验证集：2000张

用于分割person，car and bike，每一类的图片数量参考官网。

Daimler Pedestrian Benchmark Data Sets

用于分析行人行为的数据集