VGG网络两个33相当于55

最新推荐文章于 2022-07-20 13:31:46 发布

rrr2

最新推荐文章于 2022-07-20 13:31:46 发布

阅读量4.6k

点赞数 2

分类专栏：深度学习文章标签： VGG 卷积感受野

本文链接：https://blog.csdn.net/qq_35608277/article/details/79184260

版权

深度学习专栏收录该内容

119 篇文章 4 订阅

订阅专栏

VGGNet 是牛津大学计算机视觉组（Visual Geometry Group）和 Google DeepMind 公司的研究员一起研发的的深度卷积神经网络，在 ILSVRC 2014 上取得了第二名的成绩，将 Top-5错误率降到7.3%。

为什么使用3*3的卷积核比较多，几个小滤波器卷积层的组合比一个大滤波器卷积层好：
假设你一层一层地重叠了3个3x3的卷积层（层与层之间有非线性激活函数）。在这个排列下，第一个卷积层中的每个神经元都对输入数据体有一个3x3的视野。第二个卷积层上的神经元对第一个卷积层有一个3x3的视野，也就是对输入数据体有5x5的视野。同样，在第三个卷积层上的神经元对第二个卷积层有3x3的视野，也就是对输入数据体有7x7的视野。

假设不采用这3个3x3的卷积层，二是使用一个单独的有7x7的感受野的卷积层，那么所有神经元的感受野也是7x7，但是就有一些缺点。首先，多个卷积层与非线性的激活层交替的结构，比单一卷积层的结构更能提取出深层的更好的特征。其次，假设所有的数据有C个通道，那么单独的7x7卷积层将会包含C\times (7\times 7\times C)=49C^2个参数，而3个3x3的卷积层的组合仅有3\times (C\times (3\times 3\times C))=27C^2个参数。直观说来，最好选择带有小滤波器的卷积层组合，而不是用一个带有大的滤波器的卷积层。前者可以表达出输入数据中更多个强力特征，使用的参数也更少。唯一的不足是，在进行反向传播时，中间的卷积层可能会导致占用更多的内存。

总结：

在 AlexNet 基础上将单层网络替换为堆叠的3´3的卷积层和2´2的最大池化层，减少卷积层参数，同时加深网络结构提高性能；
采用 Pre-trained 方法利用浅层网络（A）训练参数初始化深层网络参数（D,E），加速收敛；
采用 Multi-Scale 方法进行数据增强、训练、测试，提高准确率。将原始图像缩放到不同尺寸 S，然后再随机裁切224´224的图片，这样能增加很多数据量，对于防止模型过拟合有很不错的效果。实践中，作者令 S 在[256,512]这个区间内取值，使用 Multi-Scale 获得多个版本的数据，并将多个版本的数据合在一起进行训练。
去掉了 LRN，减少了内存的小消耗和计算时间。

rrr2

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
VGG网络两个3*3相当于5*5

VGGNet 是牛津大学计算机视觉组（Visual Geometry Group）和 Google DeepMind 公司的研究员一起研发的的深度卷积神经网络，在 ILSVRC 2014 上取得了第二名的成绩，将 Top-5错误率降到7.3%。为什么使用3*3的卷积核比较多，几个小滤波器卷积层的组合比一个大滤波器卷积层好：假设你一层一层地重叠了3个3x3的卷积层（层与层之间有非线性激活函数
复制链接

扫一扫