科技知识干货!卷积神经网络深度与其性能之间的关系

VGG网络通过使用小卷积核和多卷积子层,探索了深度与性能的关系,构建了深度达16-19层的模型。其特点是结构简洁,小卷积核和池化核,通道数多,层数更深,全连接转卷积。这些设计提高了网络的表达能力和泛化性,至今仍广泛用于图像特征提取。
摘要由CSDN通过智能技术生成

VGG探索了卷积神经网络的深度与其性能之间的关系,成功地构筑了16~19层深的卷积神经网络,并且证明了增加网络的深度能够在一定程度上影响网络最终的性能,使错误率大幅下降,同时拓展性又很强,迁移到其他图片数据上的泛化性也非常好。

到目前为止,VGG仍然被广泛用来提取图像特征。VGG可以看成加深版本的AlexNet,二者都由卷积层、全连接层两大部分构成。VGG有如下特点。

(1)结构简洁。VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用最大化池分开,所有隐层的激活单元都采用ReLU函数。

(2)小卷积核和多卷积子层。VGG有一个重要的特点,即它具有小卷积核。VGG没有采用AlexNet中比较大的卷积核尺寸,而是降低卷积核的大小(3×3)来模仿AlexNet的网络结构,增加卷积子层数也能够达到相同的目的。这样的改进可以减少参数,并且通过增加非线性映射的次数,提高网络的拟合或表达能力。

(3)小池化核。相比AlexNet的3×3的池化核,VGG全部采用2×2的池化核。

(4)通道数多。VGG网络第一层的通道数为64,后面每层都进行了翻倍,最多512个通道。通道数的增加,使得更多的信息可以被提取出来。

(5)层数更深、特征图更宽。由于卷积核专注于扩大通道数,池化专注于缩小宽和高,使得模型架构在更深、更宽的同时,控制了计算量的增加规模。

(6)全连接转卷积。这也是VGG的一个特点。在网络测试阶段,将训练阶段的3个全连接替换为3个卷积,使测试得到的全卷积网络因为没有全连接的限制,可以接收任意宽或高的输入,这在测试阶段是非常重要的。

如图所示,输入图像是224×224×3像素点,如果后面3个层都是全连接,那么在测试阶段就只能将测试的图像全部都缩放大小到224×224×3像素点,才能符合后面全连接层的输入数量要求,这样就不便于测试工作的开展。而“全连接转卷积”可以参考图进行替换。

好啦,这次的分享就到这里,我们下期再见!欢迎在评论区补充和留言。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

36Kr网

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值