VGGNet学习笔记

最新推荐文章于 2022-10-01 10:30:38 发布

jiangjiane

最新推荐文章于 2022-10-01 10:30:38 发布

阅读量446

点赞数

文章标签： VGGNet

转载自：点击打开链接

本文为笔者学习“VERY DEEP CONVOLUTIONAL NETWORKS
FOR LARGE-SCALE IMAGE RECOGNITION”的笔记记录。
VGG论文下载链接：VERY DEEP CONVOLUTIONAL NETWORKS
FOR LARGE-SCALE IMAGE RECOGNITION

为什么选择3 * 3卷积核？
两层3 * 3卷积操作的有效区域是5 * 5（所有filter的stride=1，pad=0），示意图如下：
这里写图片描述
论文原文：It is easy to see that a stack of two 3×3 conv. layers (without spatial pooling in between) has an effective receptive field of 5×5；

三层3 * 3卷积核操作的有效区域是7 * 7（所有filter的stride=1，pad=0），示意图如下：
这里写图片描述
论文原文：
three such layers have a 7 × 7 effective receptive field.

选用3*3卷积核的优点：

使网络结构更深，学习到的特征更多，结果更具有判别性（discriminative）
三层3*3的卷积核比一层7*7的卷积核所需要的参数更少（假设卷积前后的通道数均为C）：

CONVNET CONFIGURATIONS
1.网络结构
这里写图片描述
其中D结构Classification和Location的效果综合最优，故主要分析D网络结构。

参数和内存占用分析（来源[斯坦福大学CS231课程]课件截图)：

这里写图片描述

由分析可以看出:

前面部分的卷积层占用大量内存
后面的三层全连接层占用了大量的参数

2.超参数设置

batch_size：256
momentum rate：0.9
L2 regularization rate：0.0005
dropout(只对第一第二全连接层使用）：0.5
初始化 learning rate：0.01

learning rate的补充：论文作者使用的是A结构的网络训练的参数初始化前四层卷积层和后三层全连接层，但是截至发稿时，论文作者采用了Xaiver Initialization方法，因此本笔记的learning rate针对XaiverInitialization，无需对A结构pre-training。
momentum update：可以参见博客 Lecture 6：Training Neural Networks,Part 2 ，介绍和比较各种常见的优化算法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
VGGNet学习笔记

转载自：点击打开链接本文为笔者学习“VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION”的笔记记录。 VGG论文下载链接：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION为什么选择3 * 3卷积核？两...
复制链接

扫一扫

jiangjiane CSDN认证博客专家 CSDN认证企业博客

码龄10年

128: 原创

3万+: 周排名

197万+: 总排名

215万+: 访问

: 等级

1万+: 积分

525: 粉丝

827: 获赞

194: 评论

2923: 收藏

私信

关注

热门文章

分类专栏

Linux 7篇
Other 4篇
redis 2篇
数据科学 2篇
强化学习 1篇
Linux & Ubuntu 20篇
Ubuntu 13篇
Pycharm 2篇
Python 58篇
机器学习 36篇
推荐系统 13篇
TensorFlow 9篇
深度学习 8篇
统计 4篇
NLP 8篇
Docker 10篇

最新评论

MRR-推荐算法评价指标
奝: torus的correct response为啥是tori而不是toruses呢？
Ubuntu安装fsl
2301_82150944: 为什么没有fsl的文件夹呀😭
贝叶斯通俗易懂推导
etQ_leo: 请问如果第一次尝试，A没有阻止，此时a属于高阻挠成本企业的概率该如何计算呀？算出0.32这个值的过程不太能理解
MRR-推荐算法评价指标
征途黯然.: 写得不错呀博主，继续关注!
构建Docker镜像时处理'Configuring tzdata'交互输入
lmw0320: 没搞懂，具体是安装啥包的时候，关联安装了这个tzdata? 我单独安装vim , openssh-server好像都不会，但是如果同时安装这2个包，好像就会跳出这个界面让你选择。。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。