FCN、PSPNET、Deeplab-v3的网络结构

自动化201谭梓轩

于 2023-12-25 12:02:27 发布

阅读量104

点赞数 1

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/qq_53749104/article/details/135196058

版权

FCN的网络结构：

FCN（Fully Convolutional Network）是一种用于语义分割的深度学习网络结构。它通过将全连接层替换为卷积层，实现了对输入图像的像素级别的预测。FCN网络结构包括FCN-32s、FCN-16s和FCN-8s三个版本。

FCN-32s是最简单的版本，它将VGG16网络的全连接层替换为卷积层，并在最后添加一个1x1的卷积层，输出通道数为类别数。这样，FCN-32s可以对输入图像进行密集预测，得到每个像素点的类别。

FCN-16s在FCN-32s的基础上进行了改进。它在FCN-32s的输出上进行上采样，得到与VGG16网络的pool4层相同尺寸的特征图。然后，将这个特征图与VGG16网络的pool4层的输出进行融合，得到更精细的特征表示。

FCN-8s在FCN-16s的基础上再次进行了改进。它在FCN-16s的输出上进行上采样，得到与VGG16网络的pool3层相同尺寸的特征图。然后，将这个特征图与VGG16网络的pool3层的输出进行融合，得到最终的预测结果。

通过这种级联的方式，FCN网络可以逐渐提取出不同尺度的特征信息，并将它们融合起来，从而实现对输入图像的像素级别的预测。

PSPNET的网络结构：

PSPNet（Pyramid Scene Parsing Network）是一种用于语义分割的深度学习网络结构。它利用了金字塔池化模块来捕捉不同尺度的上下文信息，从而提高了语义分割的准确性。

PSPNet的主要结构如下图所示：

```
ResNet主干网络
|
金字塔池化模块
|
上采样模块
|
分类器模块
```

PSPNet的主要步骤如下：

1. 使用ResNet作为主干网络，提取图像的特征表示。
2. 在主干网络的输出上应用金字塔池化模块。金字塔池化模块通过对不同尺度的特征图进行全局平均池化，并使用1x1卷积进行特征融合，从而捕捉不同尺度的上下文信息。
3. 使用上采样模块将池化后的特征图进行上采样，使其与原始图像尺寸相匹配。
4. 最后，使用分类器模块对上采样后的特征图进行像素级别的分类，得到最终的语义分割结果。

PSPNet的关键之处在于金字塔池化模块，它能够有效地捕捉不同尺度的上下文信息，从而提高语义分割的准确性。

Deeplab-v3的网络结构：

DeepLab-v3是一个用于语义分割的深度学习模型，最初由Google开发。它采用了深度卷积神经网络（DCNN）来实现高效的语义分割。DeepLab-v3的关键特点是采用了空洞卷积（atrous convolution）以及多尺度信息的融合。
1. 骨干网络（Backbone）： DeepLab-v3的骨干网络通常采用了深度的卷积神经网络，常见的选择包括ResNet、MobileNet等。这个网络用于提取图像的高级特征。
2. 空洞卷积（Atrous Convolution）：DeepLab-v3引入了空洞卷积，也称为扩张卷积。这种卷积允许网络在保持计算效率的同时，有效地扩大感受野，捕捉更大范围的上下文信息。
3. 多尺度信息融合：为了更好地捕捉不同尺度的信息，DeepLab-v3使用了多个并行的分支，每个分支具有不同大小的空洞卷积核。这些分支的特征图最后被整合在一起，以获取更全面的上下文信息。
4. 全局平均池化（Global Average Pooling）：为了减小最终分类层的计算量，DeepLab-v3通常使用全局平均池化，将每个通道的特征图进行平均，得到一个固定大小的特征向量。
5. 解码器（Decoder）：DeepLab-v3还包括一个解码器模块，用于将高级特征映射回输入图像的分辨率，以便生成最终的语义分割结果。

自动化201谭梓轩

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
FCN、PSPNET、Deeplab-v3的网络结构

它通过将全连接层替换为卷积层，实现了对输入图像的像素级别的预测。FCN-32s是最简单的版本，它将VGG16网络的全连接层替换为卷积层，并在最后添加一个1x1的卷积层，输出通道数为类别数。4. 全局平均池化（Global Average Pooling）：为了减小最终分类层的计算量，DeepLab-v3通常使用全局平均池化，将每个通道的特征图进行平均，得到一个固定大小的特征向量。通过这种级联的方式，FCN网络可以逐渐提取出不同尺度的特征信息，并将它们融合起来，从而实现对输入图像的像素级别的预测。
复制链接

扫一扫