VGG网络详解及感受野的计算

最新推荐文章于 2023-10-25 22:11:09 发布

小甜瓜zzw

最新推荐文章于 2023-10-25 22:11:09 发布

阅读量442

点赞数

分类专栏： pytorch深度学习文章标签：网络深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62583559/article/details/128672201

版权

pytorch深度学习专栏收录该内容

12 篇文章 1 订阅

订阅专栏

参考b站视频链接
下图是VGG的6个配置，常使用D配置
在这里插入图片描述

网络亮点：

通过堆叠3*3的卷积核来替代大尺度卷积核（减少所需参数）
可以堆叠2个33的卷积核代替55的卷积核，堆叠3个33的卷积核来替代77的卷积核

拥有相同的感受野

感受野概念：（receptive field）

输出feature map上的一个单元对应输入层上的区域大小。

在这里插入图片描述

4=（9-3）/2+1
2=（4-2）/2+1

感受野计算公式：
F(i)=(F(i+1)-1)*stride+Ksize

F(i)为第i层的感受野
stride为第I层步距
ksize为卷积核或池化核尺寸

feature map: F=1
pool1 : F=(1-1)2+2=2
conv1: F=(2-1)2+3=5
下面我们来验证VGG网络中的结论：
（VGG中stride默认为1）
Feature map: F=1
conv33(3): F(1-1)1+3=3
conv33(2): F(3-1)1+3=5
conv33(1): F(5-1)1+3=7
真的会减少所需参数嘛？
（假设输入输出channel为C，即卷积核的深度和组数）
卷积核宽卷积核高卷积核深度卷积核组数
77CC=49C方
33CC+33CC+33CC=27C方
根据D模型绘制的

22422464->maxpool->11211264->conv3_128->112112*128

学到什么：

学到了编写不同版本模型的方法。
通过列表储存网络信息。

注意：
1train.py 和之前AlexNet差不多，predict.py也和之前的差不多。
只需要改
在这里插入图片描述

如果大家在网上看别人搭建模型会在预处理的第一步将RGB三个通道分别减去下面三个值，这三个值分别对应imageNet所有图片RGB三个通道的均值。但从头开始训练就不用减。如果基于迁移学习的方式进行再训练，则需要减去。ResNet会细讲。

在这里插入图片描述

作者建议：由于VGG网络很大，而训练集样本比较小，无法充分训练。
训练过程漫长，如果有需要VGG网络训练的话，使用迁移学习训练自己的样本集。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
VGG网络详解及感受野的计算

VGG网络
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。