全连接层对于输入图像尺寸的限制问题

长命百岁️

已于 2022-03-11 19:52:43 修改

阅读量3.5k

点赞数 8

分类专栏：深度学习文章标签： cnn 人工智能神经网络

于 2022-03-11 19:48:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52852138/article/details/123432528

版权

深度学习专栏收录该内容

21 篇文章 2 订阅

订阅专栏

前言

本文以CNNs 为例，说明含有全连接层的网络，为什么需要固定输入图像的大小

CNN

在处理图像级的分类任务时，CNNs是常用的模型。我们输入图像，网络会输出一个向量，该向量中每个位置的值，往往代表我们的输入图像属于对应的类的概率，概率最大的类就是图像所属的类别。

因为输出是一个向量，而我们的输入是图像，至少是二维的（因为包含位置信息）。因此，我们需要利用全连接层来消除位置信息，将其转换成一维向量。

我们知道CNNs网络的最后几层，往往是全连接层。我们对前一层的输出进行flatten操作（将矩阵展开成一维向量，比如将28*28的矩阵展开成1*784的向量），作为全连接层的输入，然后与全连接层进行矩阵乘法，得到分类的结果向量。

当网络结构固定下来后，全连接层的参数个数也就固定下来了。比如每个神经元有28*28 = 784个参数，一共有5个神经元（也就是5个候选类别）。

我们进行矩阵乘法 $W * X = V$

$W$ 是全连接层的参数矩阵，大小为 $5 * 784$
$X$ 是全连接层的输入，大小需要为 $784 * 1$
$V$ 是全连接层的输出，大小为 $5 * 1$

在这里插入图片描述

可见，flatten后的数据的第一维大小，与全连接层参数第二维大小必须相同。而网络结构（卷积层，池化层等）是固定的，输入图像的尺寸会经过一个固定的变换。因此，输入图像的大小必须是固定的，这样才能与全连接层进行矩阵乘运算。

FCN

FCN为全卷积网络，就是将CNNs后面的全连接层都换成了卷积层。FCN处理的是像素级的分类任务，常用于语义分割。网络输出的尺寸与输入图像的尺寸相同，给予每个像素一个类别。因为网络结构中没有全连接层，因此对于一个固定的FCN网络，对输入图像的尺寸没有限制，可以接受各种尺寸的输入图像。

FCN与CNN的区别和详细介绍

长命百岁️

关注

8
点赞
踩
14

收藏

觉得还不错? 一键收藏
打赏
0
评论
全连接层对于输入图像尺寸的限制问题

前言本文以CNNs 为例，说明含有全连接层的网络，为什么需要固定输入图像的大小CNN在处理图像级的分类任务时，CNNs是常用的模型。我们输入图像，网络会输出一个向量，该向量中每个位置的值，往往代表我们的输入图像属于对应的类的概率，概率最大的类就是分类的结果。因为输出是一个向量，而我们的输入是图像，至少是二维的（因为包含位置信息）。因此，我们需要全连接层来消除位置信息，将其转换成一维向量。我们知道CNNs网络的最后几层，往往是全连接层。我们对前面一些层的输出进行flatten操作（将矩阵展开成一维向
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

长命百岁️ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。