【CV-Learning】语义分割

语义分割

定义:给图像的每个像素分配类别标签,不区别实例,只考虑像素类别。在这里插入图片描述

旧思路(滑动窗口)

在这里插入图片描述

思路:以某一个像素点为中心,选取一个区域,对该区域进行分类。
问题:效率太低,重叠的区域特征反复被计算。

新思路(全卷积)

在这里插入图片描述

思路:在Convolutions时进行pooling,使得图像尺寸及深度不变,之后得到深度为C的Scores,其中每个深度代表一个类别,可以对每个像素进行类别判断。最终通过判断每个像素的交叉熵损失之和,进行反馈对总损失进行控制,使其越低越好。
问题:Convolutions处理过程中保持图像的原始分辨率,对显存的需求十分庞大。于是可以对Convolutions过程进行优化处理,得到性能的提升。

性能提升

在这里插入图片描述

思路:在Convolutions过程中,先进行下采样,提取到高级的语义特征,之后再通过上采样将原本的学习回来,建立高级语义到类标的映射。

下采样

pooling、strided convolution

上采样t

unpooling or strided transpose convolution

硬编码上采样
在这里插入图片描述
在这里插入图片描述

可学习的上采样(转置卷积Transpose convolution)
下采样
在这里插入图片描述
上采样
在这里插入图片描述

一维上采样例子
Filter为滤波器核,是一个可以学习的矩阵。
在这里插入图片描述

卷积与矩阵相乘(一维)
以下图例均为先进行下采样,然后进行上采样复原。
例1:步长为1
在这里插入图片描述
例2:步长为2
在这里插入图片描述

UNET

上采样是根据下采样得到的高级语义得到的,但是有时候高级语义效果并不好,还需要使用低级语义。
针对这个问题,提出了UNET,将下采样过程中的低级语义整合到上采样过程中,从而使得效果更好。

整合思路:
1.将左边红色的特征通道进行拷贝,与上采样后的特征通道拼起来。
2.将左边红色的特征通道通过卷积处理后,与上采样后的特征通道拼起来。
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值