VggNet

最新推荐文章于 2020-07-18 22:15:23 发布

鱼只

最新推荐文章于 2020-07-18 22:15:23 发布

阅读量511

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/heatrain/article/details/104273184

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

VggNet是由牛津大学视觉几何组(Visual Geometry Group，VGG)的Karen Simonyan和Andrew Zisserman提出来的，VggNet在ILSVRC-2014中获得了定位任务的第一名和分类任务的第二名。

下面一起来看一下VggNet的论文《Very Deep Convolutional Networks for Large-Scale Image Recognition》。先直接给出网络设置

这篇文章个人觉得最大的贡献就是用更小的卷积核实现更深的网络。

更小的卷积核的叠加可以实现大卷积核的感受野(receptive field)(两个3x3等价于1个5x5,3个3x3等价于一个7x7

同时减少了参数数量，比如说将3个3x3堆叠起来，如果输入和输出都有C个通道，则参数为

而一个7x7的参数为

可以看出参数有明显的减少

还有一个好处是由于层之间的ReLU函数，3个卷积层的堆叠的非线性效果也比1个卷积层的非线性效果要好

从网络设置可以看出，论文探讨了A-E 6种网络结构的性能，结果如下

即E结构获得了最好的性能

同时，作者认为在更大的数据集上可能更深的网络结构会有更好的表现，即是说不同深度模型的表现与数据集的大小有关。

其他的论文提到的

图像预处理，包括random crop, horizon flip，RGB normalize

正则化，L2正则化，dropout

参数初始化，权重 w 从 N(0，0.01) 中采样，偏差 bias 初始化为0

单一尺度与多尺度训练

这里就不详细说了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。