深度学习:VGG网络

1 VGG介绍

VGG在2014年由牛津大学著名研究组VGG(Visual Geometry Group)提出,斩获该年ImageNet竞赛中Localization Task(定位任务)第一名和Classification Task(分类任务)第二名。
原论文:VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
在这里插入图片描述
网络中的亮点:通过堆叠多个3 * 3的卷积核来替换大尺度的卷积核(减少所需参数)。
论文中提到,可以通过堆叠两个3 * 3的卷积核替代5 * 5的卷积核,堆叠三个3 * 3的卷积核替代7 * 7的卷积核拥有相同的感受野

2 CNN 感受野

在卷积神经网络中,决定某一层输出结果中一个元素所对应的的输入层的区域大小,被称作感受野(receptive field)。通俗的解释是,输入feature map上的一个单元对应输入层上的区域大小。
在这里插入图片描述
感受野计算公式
F(i)=(F(i + 1) - 1) * Stride + Ksize
F(i)为第i层感受野
Stride为第i层的步距
Ksize为卷积核或池化核尺寸

Feature map:F=1
Pool1:F=(1-1) * 2 +2=2
Conv1:F=(2-1) * 2 + 3 =5

三个3 * 3的卷积核替代7 * 7的卷积核
Feature map:F=1
Conv3*3(3):F=(1-1) * 1 + 3 =3
Conv3*3(2):F=(3-1) * 1 + 3 =5
Conv3*3(1):F=(5-1) * 1 + 3 =7

使用7 * 7卷积核所需要参数,与堆叠三个3 * 3卷积核所需参数(假设输入输出channel为C):
7 * 7 * C * C = 49C^2
3 * 3 * C * C + 3 * 3 * C * C + 3 * 3 * C * C = 27C^2

3 VGG过程

通常使用D模型:
在这里插入图片描述
网络结构图
在这里插入图片描述

conv的stride为1,padding为1
maxpool的size为2,stride为2

输出尺寸
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值