【OpenMMLab 实战营打卡-第6课】机器视觉之图像分割算法基础

最新推荐文章于 2024-07-10 14:43:32 发布

A-Little-Boy

最新推荐文章于 2024-07-10 14:43:32 发布

阅读量170

点赞数

分类专栏： OpenMMLab 文章标签：算法计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xingchengyonghen/article/details/128960256

版权

OpenMMLab 专栏收录该内容

14 篇文章 1 订阅

订阅专栏

一、定义

语义分割是指将图像按照物体的类别分割成不同的区域，即对图像中的每个像素进行分类。
在这里插入图片描述

二、应用

语义分割主要应用有无人驾驶、人像分割、智能遥感和医疗影像分析等领域。

1. 无人驾驶

在无人驾驶中，语义分割要实现将图片中的行人、其他车辆、道路等交通信息按照类别在图像中分割出来，从而更好地辅助行驶车辆对周围环境的感知。
在这里插入图片描述

2.人像分割

在实时会议中快速将人像从图像中扣出，进而可以替换任意虚拟背景，也是语义分割在现实场景中的一大用处。
在这里插入图片描述

3. 医疗影像分析

图像分割可以辅助医生快速识别病变位置，能在很大程度减轻医生的工作负担。
在这里插入图片描述

三、发展

1. 基于先验知识的图像分割

基本思路就是按照颜色分割，按颜色的不同划分区域。问题是不同物体的颜色可能相近，物体内部也会有多种颜色。
在这里插入图片描述

2.基于滑动窗口的图像分割

基本思路就是逐像素进行类别划分，缺点是效率低，重叠区域会重复计算卷积
在这里插入图片描述
改进：复用卷积计算，新的问题是卷积网络中全连接层的存在要求图像输入大小固定。

改进：用卷积实现全连接层
FCN

3.恢复网络中的降采样

由于使用传统卷积对图像进行下采样，导致最终网络输出尺寸小于输入图像。对于语义分割，我们希望输出尺寸和原图保持不变。
解决方法：1.双线性插值；2.转置卷积
在这里插入图片描述
a.双线性插值

b.转置卷积

4.恢复预测图的细节

问题：高层特征经过多次下降样，细节信息丢失严重。
解决办法：整合低层次和高层次特征图信息，代表模型有UNet。
在这里插入图片描述
UNet

5.利用上下文信息

图像周围的内容也即上下文信息可以帮助我们更好对图像内容进行判断。
在这里插入图片描述
PSNet

6.DeepLab 系列

在这里插入图片描述
使用空洞卷积解决网络中的下采样问题

使用条件随机场 CRF 作为后处理手段，精细化分割图

使用多尺度的空洞卷积（ASPP 模块）捕捉上下文信息
在这里插入图片描述
以下是整个语义分割算法改进过程的总结

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【OpenMMLab 实战营打卡-第6课】机器视觉之图像分割算法基础

语义分割是指将图像按照物体的类别分割成不同的区域，即对图像中的每个像素进行分类。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。