【Deep Learning】关于CNN中全连接层的理解

最新推荐文章于 2024-05-19 11:21:31 发布

pangpd

最新推荐文章于 2024-05-19 11:21:31 发布

阅读量2.6k

点赞数 5

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43519707/article/details/103502637

版权

深度学习专栏收录该内容

16 篇文章 3 订阅

订阅专栏

全连接层（FC）在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话，全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。

在实际应用中，全连接层存在以下两种情况：
1.全连接层之前是卷积层，也就是说全连接层的输入是最后一层卷积层（如果是标准CNN结构）是H x W x C的输出，全连接层实现的过程可以理解为使用卷积核大小为H x W（h和w分别为前层卷积结果的高和宽）的全局卷积，具体使用多少个卷积核，要根据后面全连接层的神经元结点数而定。

举个栗子（糖炒栗子很好吃！）：
假如最后卷积层的输出是7x7x512（VGG-16），如果后层的全连接层含4096个神经元，则使用卷积核为7x7x512x4096全局卷积来实现这一全连接运算过程。

2.全连接层之前还是全连接层，很容易理解，全连接层后又跟一个全连接层，可以转化为用卷积核为1x1的卷积对前层FC的卷积操作，输出后层FC。

再举个栗子（糖炒山楂也不错！）：
假如前层FC的输出是4096个神经元，后再叠加一个2048个神经元的FC，我们可以把它想象成一个1x1x4096的feature map使用2048个大小为1x1x4096的卷积核进行卷积运算操作。

不过，这里面有个问题，全连接层到底用卷积实现的，还是直接flatten的？
其实两种理解方式的不同，最终得到的效果是一样的，我觉得没必要纠结这一点。
文献《Going Deeper with Contextual CNN for Hyperspectral Image Classification》也提到:

Note that convolving a 1 x 1 x d blob with l filters whose size is 1 x 1 x d can achieve the same effect as fully connecting the 1 x 1 x d input blob to l output nodes.

这里是说，对于1 x 1 x d的特征图，使用1 x 1 x d大小的卷积核去卷积与1 x 1 x d的输入进行全连接操作输出l个神经元效果是相同的。

参考链接：
https://zhuanlan.zhihu.com/p/33841176
https://www.zhihu.com/question/41037974

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【Deep Learning】关于CNN中全连接层的理解

全连接层（FC）在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话，全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。