卷积核3x3 vs 7x7

感受野

感受野:原指听觉、视觉等神经系统中一些神经元的特性,即 神经元只接受其所支配的刺激区域内的信号。在视觉神经系统中,视觉皮层中神经细胞的输出依赖于视网膜上的光感受器。当光感受器受刺激兴奋时,会将神经冲动信号传导至视觉皮层。不过需指出并不是所有神经皮层中的神经元都会接受这些信号。正是由于感受野等功能结构在猫的视觉中枢中的发现,催生了福岛邦彦提出多卷积和子采样操作的多层神经网络。

卷积核:3x3 vs 7x7

而现代卷积神经网络中的感受野又是怎样一回事?我们慢慢道来。先以单层卷积操作为例,如图是一个7×7,步长为1的卷积操作,对后层的每一个输出神经元(如紫色区域)来说,它的前层感受野即为黄色区域,可以发现,这与神经系统的感受野定义大同小异。不过,由于现代卷积神经网络拥有多层甚至超多层卷积操作,随着网络深度的加深,后层神经元在第一层输入层 的感受野会随之增大。如图所示为3 × 3,步长为1的卷积操作,同单层卷积操作一样,相邻两层中后层神经元在前层的感受野仅为 3 × 3,但随着卷积操作的叠加,第 L+3 层的神经元在第 L 层的感受野可扩增至7 × 7
在这里插入图片描述
也就是说,小卷积核(如3×3)通过多层叠加可取得与大卷积核(如 7×7) 同等规模的感受野,此外采用小卷积核同时可带来其余两个优势:

  • 第一,由于小卷积核需多层叠加,加深了网络深度进而增强了网络容量和复杂度;
  • 第二,增强网络容量的同时减少了参数个数;
    若假设上述示例中卷积核对应的输入输出特征张量的深度均为 C,则 7×7 卷 积核对应参数有 C×(7×7×C) = 49C^2 个。而三层3×3卷积核堆叠只需三倍单层3×3卷积核个数的参数,即 3×[C × (3 × 3 × C)] = 27C^2,远小于 7×7卷积核的参数个数。

附录:

  • 网络容量:神经网络的假设空间;
  • 假设空间:指一个机器学习算法可以生成的所有函数的集合。这个函数集合就代表了一个机器学习算法的拟合能力。

摘自:

  • 魏秀参:解析卷积神经网络
  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

uncle_ll

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值