计算机视觉：语义分割(semantic segmentation)相关知识点

最新推荐文章于 2024-03-21 16:51:12 发布

Akita·wang

最新推荐文章于 2024-03-21 16:51:12 发布

阅读量1.7k

点赞数

分类专栏：深度学习文章标签：计算机视觉 python 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19168521/article/details/113873273

版权

本文探讨语义分割的基本思路、常用数据集和关键技巧，包括全卷积网络、反卷积、扩张卷积及条件随机场。重点介绍了PASCAL VOC 2012、MS COCO和Cityscapes数据集，并阐述了如何利用低层信息和NAS方法提升分割效果。

摘要由CSDN通过智能技术生成

目录

语义分割(semantic segmentation)相关知识点

语义分割(semantic segmentation)相关知识点

语义分割是目标检测更进阶的任务，目标检测只需要框出每个目标的包围盒，语义分割需要进一步判断图像中哪些像素属于哪个目标。

计算机视觉任务的困难：拍摄视角变化、目标占据图像的比例变化、光照变化、背景融合、目标形变、遮挡等。

(1) 语义分割常用数据集

PASCAL VOC 2012 1.5k训练图像，1.5k验证图像，20个类别(包含背景)。

MS COCO COCO比VOC更困难。有83k训练图像，41k验证图像，80k测试图像，80个类别。

Cityscapes城市街景图像数据

(2) 语义分割基本思路

基本思路 ：逐像素进行图像分类。我们将整张图像输入网络，使输出的空间大小和输入一致，通道数等于类别数，分别代表了各空间位置属于各类别的概率，即可以逐像素地进行分类。

全卷积网络+反卷积网络:为使得输出具有三维结构，全卷积网络中没有全连接层，只有卷积层和池化层。但是随着卷积和池化的进行，图像通道数越来越大，而空间大小越来越小。要想使输出和输入有相同的空间大小，全卷积网络需要使用反卷积和反池化来增大空间大小。在这里插入图片描述
反卷积(deconvolution)/转置卷积(transpose convolution)

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
计算机视觉：语义分割(semantic segmentation)相关知识点

目录语义分割(semantic segmentation)相关知识点(1) 语义分割常用数据集(2) 语义分割基本思路(3) 语义分割常用技巧语义分割(semantic segmentation)相关知识点语义分割是目标检测更进阶的任务，目标检测只需要框出每个目标的包围盒，语义分割需要进一步判断图像中哪些像素属于哪个目标。计算机视觉任务的困难：拍摄视角变化、目标占据图像的比例变化、光照变化、背景融合、目标形变、遮挡等。(1) 语义分割常用数据集PASCAL VOC 2012 1.5k训练图像，1
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。