48 全连接卷积神经网络 FCN【动手学深度学习v2】

JennnyZhang

于 2024-04-09 17:26:51 发布

阅读量478

点赞数 4

分类专栏：李沐深度学习文章标签：深度学习 cnn 人工智能李沐笔记神经网络网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53826699/article/details/137559902

版权

李沐深度学习专栏收录该内容

34 篇文章 4 订阅

订阅专栏

全卷积网络(FCN)是一种用于图像语义分割的CNN变体，通过替换全连接层为卷积层，适应任意尺寸输入。文章介绍了FCN的基本设计、优势与优化方法，包括1x1卷积减少信息损失及跳跃连接提升细节。

摘要由CSDN通过智能技术生成

全连接卷积神经网络：神经网络处理语义分割问题的奠基性工作，目前已不太常用。

了解一下全卷积网络模型最基本的设计。如下图所示，全卷积网络先使用卷积神经网络抽取图像特征，然后通过1×1卷积层将通道数变换为类别个数，最后通过转置卷积层将特征图的高和宽变换为输入图像的尺寸。因此，模型输出与输入图像的高和宽相同，且最终输出通道包含了该空间位置像素的类别预测。

知识补充：

只考虑精度不考虑速度的话推荐使用rcnn

出于对训练速度的考虑，本节网络中的1*1卷积层，将7*7*512的数据结构直接压缩到了7*7*class_num，造成了较大的信息损失，若要对预测效果进行进一步优化的话可以调节这一层

13.11. 全卷积网络https://zh-v2.d2l.ai/chapter_computer-vision/fcn.html

全连接卷积神经网络（Fully Convolutional Neural Network，FCN）是一种特殊类型的卷积神经网络（CNN），主要用于图像语义分割任务。与传统的CNN不同，FCN通过完全使用卷积层来替代全连接层，从而实现对任意尺寸输入图像进行像素级别的预测。

传统的CNN通常包含卷积层和全连接层。卷积层用于提取图像的局部特征，而全连接层将卷积层的输出转换为固定长度的向量，用于分类任务。然而，全连接层对输入图像的尺寸有限制，无法处理变化尺寸的输入图像。

FCN通过将全连接层替换为卷积层，使得网络可以接受任意尺寸的输入图像，并且能够输出与输入图像尺寸相同的特征图。这种特性使得FCN非常适用于图像语义分割任务，其中目标是为每个像素分配一个语义标签。

FCN的关键思想是使用卷积层进行下采样和上采样操作，以保持空间信息。下采样通过使用具有较大步幅的卷积层或池化层来减小特征图的尺寸，同时增加特征图的深度。上采样通过使用转置卷积等操作将特征图的尺寸恢复到输入图像的尺寸，同时进行特征图的细化。

在FCN中，通常采用编码器-解码器结构。编码器部分由多个卷积层和池化层组成，用于提取图像的特征表示。解码器部分则通过上采样操作将低分辨率的特征图恢复到输入图像的尺寸，并生成像素级别的预测。此外，FCN通常使用跳跃连接（Skip Connections）来融合不同层级的特征，以提高分割结果的细节和准确性。

FCN在图像语义分割任务中取得了很大的成功，成为了一种重要的架构。它在许多计算机视觉领域的应用中广泛使用，如医学图像分析、自动驾驶、图像生成等。

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
48 全连接卷积神经网络 FCN【动手学深度学习v2】

如下图所示，全卷积网络先使用卷积神经网络抽取图像特征，然后通过1×1卷积层将通道数变换为类别个数，最后通过转置卷积层将特征图的高和宽变换为输入图像的尺寸。因此，模型输出与输入图像的高和宽相同，且最终输出通道包含了该空间位置像素的类别预测。出于对训练速度的考虑，本节网络中的1*1卷积层，将7*7*512的数据结构直接压缩到了7*7*class_num，造成了较大的信息损失，若要对预测效果进行进一步优化的话可以调节这一层。全连接卷积神经网络：神经网络处理语义分割问题的奠基性工作，目前已不太常用。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。