卷积层代替全连接层

最新推荐文章于 2024-05-14 03:03:49 发布

时光机ﾟ

最新推荐文章于 2024-05-14 03:03:49 发布

阅读量1.3w

点赞数 7

分类专栏：深度学习文章标签：卷积层代替全连接层

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19784349/article/details/81348135

版权

深度学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

为什么卷积层可以“代替”全连接层？

卷积和全连接的区别大致在于：卷积是局部连接，计算局部信息；全连接是全局连接，计算全局信息。（但二者都是采用的点积运算）

但如果卷积核的kernel_size和输入feature maps的size一样，那么相当于该卷积核计算了全部feature maps的信息，则相当于是一个 $kernel\_size*1$ 的全连接。

在全连接层上，相当于是 $n * m$ （其中 $n$ 是输入的维度， $m$ 是输出的维度）的全连接，其计算是通过一次导入到内存中计算完成；如果是在最后一个feature maps上展开后进行的全连接，这里若不进行展开，直接使用 $output\_size$ 的卷积核代替，则相当于是 $n * 1$ 的全连接（这里的 $n$ 就是feature maps展开的向量大小，也就是卷积核的大小 $kernel\_size*kernel\_size$ ），使用 $m$ 个卷积核则可以相当于 $n * m$ 的全连接层。

但用卷积层代替全连接层的方式，其卷积核的计算是并行的，不需要同时读入内存中，所以使用卷积层的方式代替全连接层可以加开模型的优化。

为什么(在分类网络上)不能直接用卷积层代替全连接层的方式，使得模型处理不同大小的输入？

因为卷积层的运算是通过卷积核，说到底也就是点积运算，是需要事先设定参数的大小。
但如果这种操作用于处理不同size的输入，则实际上每次训练时，该层的参数size是不一样的，也就是模型不能得到训练。
虽然使用卷积层代替全连接层来处理不同大小输入的模型在整个流程上看起来没什么问题，但根本上，该模型是不能得到良好训练的。（从代替的那层卷积层开始，其后的每一层得到的输入分布其实是一直在变化的，所以波动会比较大。）

关注

7
点赞
踩
34

收藏

觉得还不错? 一键收藏
10
评论
卷积层代替全连接层

为什么卷积层可以“代替”全连接层？卷积和全连接的区别大致在于：卷积是局部连接，计算局部信息；全连接是全局连接，计算全局信息。（但二者都是采用的点积运算）但如果卷积核的kernel_size和输入feature maps的size一样，那么相当于该卷积核计算了全部feature maps的信息，则相当于是一个kernel_size∗1kernel_size∗1kernel\_size...
复制链接

扫一扫

专栏目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。