语义分割------FCN、deeplab演变理论知识点

最新推荐文章于 2024-04-29 12:39:13 发布

小飞龙程序员

最新推荐文章于 2024-04-29 12:39:13 发布

阅读量704

点赞数

分类专栏：目标检测文章标签：深度学习计算机视觉 cnn

本文链接：https://blog.csdn.net/m0_47405013/article/details/127078558

版权

目标检测专栏收录该内容

40 篇文章 1 订阅 ¥119.90 ¥299.90

订阅专栏

超级会员免费看

语义分割通过为图像中的每个像素打标签实现目标区分。经典论文如FCN首次提出全卷积网络，解决了分辨率恢复问题；SegNet利用编码-解码结构平衡精度与内存；U-Net适用于轻量化任务；Dilated Convolution扩大感受野；RefineNet与Deeplab系列则通过多尺度信息处理和空洞卷积提升分割效果。

摘要由CSDN通过智能技术生成

一、个人理解
语义分割，其实就是为图片中的每个像素打上相应的标签，即将其所代表的语义具现化，呈现出的视觉效果就是图片中不同的目标有不同的颜色.
目前语义分割主要针对的问题是以下几点：
1）如何恢复原有的分辨率
2）如何尽可能的增大感受野
3）如何处理多尺度问题
下面，会以时间为顺序，给出在语义分割领域比较经典的论文。

二、相关论文
1、FCN
这一篇论文应该说是语义分割开始兴起的开山之作，主要贡献如下：
1）针对普通分类网络用于分割效果较差的问题，文章第一次提出抛弃全连接层，使用全卷积神经网络的架构，突破了以往的网络输入图片尺寸必须固定大小的限制，为以后的分割网络所沿用。
2）使用了反卷积操作进行恢复分辨率。
3）为了得到更加精细的分割结果，使用了跳跃连接，通过中层的语义信息来改善分割结果。
在FCN出现之前，大多数的分割网络针对像素进行分类都是找到包含这个像素的一块区域，将这块区域的类别作为像素点的类别，显然这样操作耗费内存，而且区域可能会重叠，效率低下。FCN是第一次尝试从抽象的语义特征直接对像素进行分类。
这篇论文具体解决的问题是如何恢复原有的分辨率，从网络来看，进行了多次的反卷积操作，每一次反卷积之后&#x