VGGNet简介及VGG13实现cifar100分类

最新推荐文章于 2024-05-24 01:00:00 发布

梅菜扣肉鱼丸粗面

最新推荐文章于 2024-05-24 01:00:00 发布

阅读量3.1k

点赞数

分类专栏：深度学习机器学习文章标签：深度学习 tensorflow 卷积神经网络 VGG13 cifar100

本文链接：https://blog.csdn.net/qushuo123/article/details/111504956

版权

本文介绍了VGGNet的背景，VGG13的网络结构及其创新点，包括3*3卷积核和1*1卷积核的应用。此外，还详细阐述了VGG13在cifar100数据集上的实现过程，展示了TensorFlow代码关键步骤，并分析了在cifar100上的识别效果。

摘要由CSDN通过智能技术生成

VGGNet简介

VGGNet由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络。VGG名字来源于Visual Geometry Group, Department of Engineering Science, University of Oxford。它探索了卷积神经网络的深度和其性能之间的关系，通过反复的堆叠3*3的小型卷积核和2*2的最大池化层，成功的构建了16~19层深的卷积神经网络。VGGNet获得了ILSVRC 2014年识别比赛的亚军，在top5上的错误率为7.3%。目前为止，VGGNet大多被用来提取图像的特征。

下图是前几年ImageNet识别比赛的效果，可以看到2014年的冠军是被GoogLeNet拿到(为了纪念深度学习三驾马车之一的Yann LeCun提出的LeNet)。相比于2012年横空出世的具有启发意义的AlexNet来说，也降低了9.1%的错误率。当然对于最实用的残差神经网络ResNet还是有点差距的，因此现在大多用VGG来提取特征，不是简单的用于识别与分类。

VGG的网络结构图和参数表如下：

VGG的创新之处

1、采用3*3卷积核等较小的卷积核代替7*7等较大的卷积核。采用三个3*3的卷积核可以达到7*7卷积核的效果，即3个3*3的卷积核的整体感受野与7*7的相当，但总共只需要3*3*3=27个参数，而7*7的需要49个参数，也就是说参数量可以减少将近一倍。同时一个7*7的卷积层后面跟一个非线性层，而三个3*3的每个后面跟一个非线性层，总共有三个，因此还可以增加网络深度和表达能力。

2、首次采用了1*1的卷积核。1*1卷积核并没有造成图像大小变化，但会引入非线性函数，因此可以提高表达能力。而且还能进行降维。

VGG的缺点

1、VGG某种意义上仍属于传统的卷积网络，因此当层数过深时，就会出现参数过大，训练困难的局面。

2、VGG达到19层时便已经饱和，继续增加网络深度效果并不会变好。

因此，ResNet产生，网络深度无限叠加成为了可能。

VGG13实现cifar100分类

cifar100

CIFAR数据集是 Visual Dictionary(Teaching computers to recognize objects) 的子集，由三个教授收集，主要来自google和各类搜索引擎的图片。

这个数据集和cifar10类似，它有100个类，每个类包含600个图像，600个图像中有500个训练图像和100个测试图像。100类实际是由20个类(每个类又包含5个子类)构成(5

最低0.47元/天解锁文章

梅菜扣肉鱼丸粗面

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
VGGNet简介及VGG13实现cifar100分类

VGGNet简介VGGNet简介VGGNet由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络。VGG名字来源于Visual Geometry Group, Department of Engineering Science, University of Oxford。它探索了卷积神经网络的深度和其性能之间的关系，通过反复的堆叠3*3的小型卷积核和2*2的最大池化层，成功的构建了16~19层深的卷积神经网络。VGGNet获得了ILSVRC 2014年识别比.
复制链接

扫一扫

专栏目录