关于图像语义分割

最新推荐文章于 2024-07-30 20:27:07 发布

编码视界

最新推荐文章于 2024-07-30 20:27:07 发布

阅读量2.2k

点赞数

分类专栏： machine-learning

本文链接：https://blog.csdn.net/jing_xian/article/details/79200690

版权

本文探讨图像语义分割，区别于传统图像分割，它基于深度学习的CNN和RNN，采用监督学习。强调了图像语义分割的密集分类特性，特别是带洞卷积在扩大感知域中的作用。此外，还讨论了全卷积网络的输入限制、SPP结构的运用以及语义分割中的损失函数类型。

摘要由CSDN通过智能技术生成

1、图像分割与图像语义分割的区别
传统的图像分割算法基于无监督学习，不知道分割出来的对象的类别。图像语义分割一般基于深度学习，主要是用CNN，也有个别会用到RNN的；此外，图像语义分割属于监督学习的任务，即在训练时会给出每个像素的类别。

2、图像的密集分类问题
语义分割是个密集分类问题，需给每个像素分类，故语义分割和图像分类的目标有较大差异。为了适应这种差异，人们提出了带洞卷积。带洞卷积在语义分割中很受欢迎，因为带洞卷积可以在不扩大滤波器维度的情况下有效地增大感知域。

3、带洞卷积的起源与变异
带洞卷积（dilated convolution），也叫atrous convolution。语义分割中的带洞卷积起源于图像小波分解中的补零滤波器，但语义分割中的带洞卷积不存储零值以减少参数和计算量。
相比于普通的卷积，相同核大小的空洞卷积能有效地扩大感知域（conception field）。dilation rate为1时，等同于普通卷积；dilation rate大于1时，带洞卷积核两点之间间隔dilation rate减1（即下图WaveNet中的Dilation）。