【图像分类】更深的网络VGGNet

1.VGGNet概述:

VGGNet在AlexNet基础上创建了更深层的网络,与GoogLeNet一起在2014年image net竞赛中表现出色。VGGNet和GoogLeNet一起进一步提升了深度学习在图像领域的表现。VGGNet证明了在一定程度上随着网络的加深,网络的能力也有明显的提高。

2.VGGNet网络结构

VGGNet网络中提供了多种网络结构,A-E的网络结构是基本一致的,最大的区别在于结构中卷积核的数量和大小不同,目前普遍使用的是D,E两种结构,即为人熟知的VGG16和VGG19。

以VGG16为例:

input图像输入为224*224*3

第一层结构:3*3*64串联3*3*64串联maxpooling。此层结构采用了3*3的卷积核进行串联,这个串联结构是VGG的首创,并且取得了非常不错的结果。

第二层结构:3*3*128串联3*3*128串联maxpooling。

第三层结构:3*3*256串联三次,再串联maxpooling

第四层结构:3*3*512串联三次,再串联maxpooling

第五层结构:3*3*512串联三次,再串联maxpooling

最后:两层FC全链接,利用softmax输出。

 

VGG结构的主要特点:

1.用小的卷积核串联替代大的卷积核:

例如用两个3*3的卷积核串联可以替代一个5*5的卷积核,用3个3*3的卷积核串联可以替代一个7*7的卷积核。如图所示,两个串联的3*3卷积核感受野和单独的5*5卷积核完全一样。

用小卷积核串联的方法替代大卷积核有什么优势呢:

(1)增加了非线性函数,增强网络的判别力。对于一个大的卷积核来说只有一个非线性激活函数,但是对于多个小卷积核的串联,可以经过多个非线性激活函数。因此,模型能够抽取得到更具有表达力的特征。

(2)减少卷积参数。对于一个(C,H,W)的图片,7*7的卷积核需要参数数量为

2.递增的通道数。

受到AlexNet的启发,VGGNet采用了输出的feature map通道递增的方法,层数越深输出通道数越多。这样特征维度越高,能够获得的特征类型越丰富。

3.最后一层采用全卷积替换全连接。

使用1*1的卷积替代全连接网络,这样做可以接收任意宽高图片作为输入。

4.实验证明了LRN的无用

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值