卷积神经网络的卷积核大小如何确定

哦...

已于 2023-07-12 13:13:56 修改

阅读量3.9k

点赞数 1

分类专栏： python 文章标签：卷积神经网络卷积核计算复杂度特征提取深度学习

于 2021-07-06 01:54:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/piglite/article/details/118503275

版权

python 专栏收录该内容

86 篇文章 6 订阅

订阅专栏

卷积神经网络中的卷积核大小是越小越好么?

本回答仅给出为何流行的DCNN通常采用小而深的卷积核。请看下面的截图，可以给出一点启发。（出自海德堡大学HCI人工智能lecture）

上左图：假设卷积核（又叫filter，neuron）是3*3，第一层卷积核的中心pixel，可以“看到”（receptive field）输入图3*3的区域（这里把它理解成“连通性”），第二层卷积核作用在第一层之上，这个卷积核的中心pixel可以“看到”原图的区域扩大成5*5。

上右图：把三个3*3的卷积核堆积起来，第三层中的一个pixel，可以“看到”原图的pixel个数，和一个7*7卷积核一样。

下左图：但是计算复杂度，1个7*7卷积核的复杂度是49M（M是一个常数），三个3*3的复杂度是27M。

下右图：嫌3*3这个filter还不够小？那么再把它拆成俩个1*3的"向量”卷积核吧！结果是复杂度从9降到了6！

结论：几个小的卷积核（例如3*3）叠加（stack）在一起，相比一个大的卷积核（例如7*7），与原图的连通性不变，但是却大大降低了参数的个数以及计算复杂度！

一个直观的例子（截图）：

上图是一个7*7的卷积核（神经元），它可以刻画（识别）右图中的曲线(当输入图片出现右图中的模式时，这个神经元就会“放电”)。然而，由于空间太小，一个3*3的卷积核却表示不了。搞三个3*3的叠加不就行了嘛！（把叠加想象成拼图，于是右图可以由三小块拼成）。

我们还可以使用一个100*100的卷积核，它可以刻画几乎任何复杂的形状。但是，复杂度实在太高。或许用20个3*3的卷积核叠加就可以复现上面的任何形状。

结论：这就是深度学习！

喜欢小而深，厌恶大而短（这里指的是卷积核大小和层数）。

如果输入图像是灰度图（高，宽），那么3*3的卷积核的shape也是(3,3)，20个卷积核会提取出图像的20个特征。如果输入图是彩色图，那么输入的内容就至少有3个通道，那么3*3的卷积核shape也是（3,3,3）。此时在提取特征图的运算过程如下图所示：

由w0过滤得到的特征图某位置（i,j）处的值，是由三个通道上（i,j）处的卷积结果相加得到。在有偏置的情况下，还要再加上偏置（w0有偏置1）。如果还有激活函数的话，还要将前面相加的结果经过一次激活函数的运算。图例中2个卷积核对输入层三通道内容进行提取后，得到了两个特征图。参数数量由输入层的7*7*3（宽*高*通道数量）变为了3*3*2（宽*高*特征图数量）。

上述过程再用一张形象的图来表示：

CNN卷积核与通道讲解

卷积过程中，输入层有多少个通道，卷积核就要有多少个通道。但卷积核的数量是任意的，卷积核的数量决定了卷积后的特征图数量。

本文参考了：

卷积神经网络的卷积核大小、卷积层数、每层map个数都是如何确定下来的呢？

多通道的多个卷积核

关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

哦... CSDN认证博客专家 CSDN认证企业博客

码龄13年

171: 原创

3万+: 周排名

30万+: 总排名

91万+: 访问

: 等级

7514: 积分

352: 粉丝

663: 获赞

120: 评论

2272: 收藏

私信

关注

热门文章

分类专栏

前端 3篇
Spring 3篇
Java Web 11篇
GO 1篇
IO
重定向
我的安卓文章 11篇
mysql 2篇
python 86篇
typescript 1篇
egret 1篇
javascript 4篇
misc 3篇
C++ 13篇

最新评论

IDEA使用gitee 史诗级保姆教程
爱敲代码的羊驼: 你好作者我想问一下如果用Log in via Gitee的方式登录出现无效的登录回调地址应该怎么解决
MySQL安装过程出现starting the server报错的解决方案
m0_74353760: 感谢博主终于装上了
IDEA使用gitee 史诗级保姆教程
白也白泽: nice兄弟呀！
select语句的执行顺序
梁茂新: 太酷了，解决了我的疑惑
浮点数的二进制表示
做而论道_CS: 浮点数什么？浮点数，就是计算机中 “科学记数法”。上过初一的，都知道科学记数法：　N = ± 绝对值 × 10^e。绝对值，当然是正数，由一位整数、多位小数组成。 e 则是以 10 为底的指数。将此法，引入到计算机中，就是 “浮点数” 了。 N 以浮点数存放的格式是：　N = (－1)^S × 2^E × (1.) M。 S，代表了 N 的符号。后面的 E，称为阶码，其值为：指数 e + 127。最后的 (1.) M，就是绝对值，整数部分的 1 被省略了。在这个 M 中，并没有符号位，所以，它只是一个无符号数。因此，就不要扯什么 “原码” 了。把 “科学记数法” 中的 “绝对值、指数 e”，拿来换算一下，就是计算机中的 “浮点数” 了。浮点数的运算：　相加减，要先对阶，再用绝对值的补码加减。　相乘除，就是绝对值相乘除、阶码相加减。得出了运算的结果后，还需要整理成规范的形式。其实，计算机中的浮点数运算，是由 “浮点机” 实现的。（什么是定点机、浮点机？　你可别说不知道啊！）诸如：对阶、上下溢、规格化...，都是由硬件完成的。硬件的原理及其设计，就由 “电子信息专业” 去干吧。计算机专业的老师，就不要在这里哗众取宠了。计算机专业的学生，学了这些，也是 P 用都没有的。学上半年，也不过是隔靴搔痒而已。计算机专业，了解一点 “定点数、补码” 就行了。当然，对于那些没上过中学又想冒充高雅的人，学就学吧。学与不学都可以的，反正也没有什么用处。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。