【计算机视觉】图像分割中FCN、DeepLab、SegNet、U-Net、Mask R-CNN等算法的讲解（图文解释超详细）

showswoller

已于 2022-12-08 17:36:32 修改

阅读量2.5k

点赞数 19

分类专栏：计算机视觉文章标签：计算机视觉 cnn 人工智能算法深度学习

于 2022-12-08 17:32:57 首次发布

本文链接：https://blog.csdn.net/jiebaoshayebuhui/article/details/128239096

版权

计算机视觉专栏收录该内容

23 篇文章 19 订阅

订阅专栏

觉得有帮助请点赞关注收藏~~~

一、FCN分割算法

全卷积神经网络目标分割算法能够端到端的得到每个像素的目标分类结果，与传统的卷积神经网络只能输入固定大小图像和在网络的末端使用几个全连接层得到固定长度的特征向量不同，全卷积神经网络能够接受任意大小尺寸的输入图像，并且网络中没有使用全连接层，而是全部使用卷积层，全卷积神经网络采用反卷积层取代简单的线性插值算法，对最后一个卷积层的特征图进行上采样，使用反卷积可以对卷积进行逆操作

FCN算法采用VGGNet为基础网络，并把VGGNet的最后三层全连接层改为卷积层，最后采用跳跃式结构融合多尺度特征产生与原图大小一致的每个像素图类别图

二、DeepLab图像分割算法

DeepLab图像分割算法主要由两部分所组成：深度卷积神经网络和条件随机场，该方法的主要创新点就是条件随机场部分，该方法的主要创新点就是条件随机场部分，为了能够取得类似于传统条件随机场的全局优化效果，利用循环的方式将上一层的输出作为下一层的输入，其中采用的条件随机场架构是基于全局连接模型，图像分割的条件随机场推理的关键因素就是将类别标号问题转变成概率推理问题。

DeepLab分割算法将条件随机场作为后置的处理加在全卷积神经网络的结果上，用来改善图像分割的结果，这种通过将全卷积神经网络与条件随机场组合得到了较好的结果

三、SegNet图像分割算法

SegNet图像分割算法是一个编码器-解码器结构的卷积神经网络，SegNet算法结果如下图，这是一个对称网络，左边是卷积提取高维特征，卷积后不改变图片大小，通过池化来使图片变小，该部分为编码器部分，右边是反卷积与上采样，上采样使用的使反池化的方式将图像变大，通过反卷积使上采样后的图像信息变得丰富，使得在池化过程丢失的信息可以在学习后得到

SegNet中的池化层多了一个索引的功能，在每次进行最大池化的过程中都会保存滤波器中最大权值的相对位置，在利用反池化的方式进行上采样的时候就能对最大权值的区域信息进行恢复，其余信息则会丢失，因此，SegNet使用可学习的反卷积将缺失的内容进行填充。

四、U-Net算法

U-Net是受到FCN启发针对医学图像做语义分割，且可以利用少量的数据学习到一个对边缘提取十分鲁棒的模型，在生物医学图像分割领域有很大作用，大体由收缩和扩张路径组成，因为形似一个字母U，得名U-Net，收缩路径利用传统卷积神经网络的卷积池化组件，其中经过一次下采样之后从层数变为原来的2倍，扩张路径由2×2的反卷积实现，反卷积的输出通道为原来通道数的一半，与原来的特征图串联，从而得到和原来一样多的通道数的特征图

U-net与其他常见的分割网络有一点非常不同的地方：U-net采用了完全不同的特征融合方式：拼接，U-net采用将特征在层（channel）的维度拼接在一起，形成更厚的特征。而FCN融合时使用的对应点相加，并没有形成更厚的特征。

五、Mask R-CNN算法

它是一个小巧灵活的通用对象实例分割框架，它不仅可对图像中的目标进行检测，还可以对每一个目标给出一个高质量的图像分割结果，取得了十分不错的结果

如图4-7所示，Mask R-CNN分为两个分支：

（1）第一个分支为原始Faster R-CNN的结构，它用于对候选窗口进行分类和窗口坐标回归。

（2）第二个分支对每一个感兴趣区域（Region of Interest，RoI）预测分割掩模，这个分支采用了图像分割的经典算法-FCN结构。

创作不易觉得有帮助请点赞关注收藏~~~

showswoller

关注

19
点赞
踩
51

收藏

觉得还不错? 一键收藏
打赏
0
评论
【计算机视觉】图像分割中FCN、DeepLab、SegNet、U-Net、Mask R-CNN等算法的讲解（图文解释超详细）

【计算机视觉】图像分割中FCN、DeepLab、SegNet、U-Net、Mask R-CNN等算法的讲解（图文解释超详细）
复制链接

扫一扫