VGGNet简介及VGG13实现cifar100分类

本文介绍了VGGNet的背景,VGG13的网络结构及其创新点,包括3*3卷积核和1*1卷积核的应用。此外,还详细阐述了VGG13在cifar100数据集上的实现过程,展示了TensorFlow代码关键步骤,并分析了在cifar100上的识别效果。
摘要由CSDN通过智能技术生成

目录

VGGNet简介

VGGNet简介

VGG的创新之处

VGG的缺点

VGG13实现cifar100分类

cifar100

tensorflow实现VGG13


VGGNet简介

VGGNet简介

 VGGNet由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络。VGG名字来源于Visual Geometry Group, Department of Engineering Science, University of Oxford。它探索了卷积神经网络的深度和其性能之间的关系,通过反复的堆叠3*3的小型卷积核和2*2的最大池化层,成功的构建了16~19层深的卷积神经网络。VGGNet获得了ILSVRC 2014年识别比赛的亚军,在top5上的错误率为7.3%。目前为止,VGGNet大多被用来提取图像的特征。

下图是前几年ImageNet识别比赛的效果,可以看到2014年的冠军是被GoogLeNet拿到(为了纪念深度学习三驾马车之一的Yann LeCun提出的LeNet)。相比于2012年横空出世的具有启发意义的AlexNet来说,也降低了9.1%的错误率。当然对于最实用的残差神经网络ResNet还是有点差距的,因此现在大多用VGG来提取特征,不是简单的用于识别与分类。

 

VGG的网络结构图和参数表如下:

VGG的创新之处

1、采用3*3卷积核等较小的卷积核代替7*7等较大的卷积核。采用三个3*3的卷积核可以达到7*7卷积核的效果,即3个3*3的卷积核的整体感受野与7*7的相当,但总共只需要3*3*3=27个参数,而7*7的需要49个参数,也就是说参数量可以减少将近一倍。同时一个7*7的卷积层后面跟一个非线性层,而三个3*3的每个后面跟一个非线性层,总共有三个,因此还可以增加网络深度和表达能力。

2、首次采用了1*1的卷积核。1*1卷积核并没有造成图像大小变化,但会引入非线性函数,因此可以提高表达能力。而且还能进行降维。

VGG的缺点

1、VGG某种意义上仍属于传统的卷积网络,因此当层数过深时,就会出现参数过大,训练困难的局面。

2、VGG达到19层时便已经饱和,继续增加网络深度效果并不会变好。

因此,ResNet产生,网络深度无限叠加成为了可能。

VGG13实现cifar100分类

cifar100

CIFAR数据集是 Visual Dictionary(Teaching computers to recognize objects) 的子集,由三个教授收集,主要来自google和各类搜索引擎的图片。

这个数据集和cifar10类似,它有100个类,每个类包含600个图像,600个图像中有500个训练图像和100个测试图像。100类实际是由20个类(每个类又包含5个子类)构成(5

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值