keras—VGG16

最新推荐文章于 2024-06-14 21:57:21 发布

小麦粒

最新推荐文章于 2024-06-14 21:57:21 发布

阅读量8.1k

点赞数 8

分类专栏： keras

本文链接：https://blog.csdn.net/u010986753/article/details/98777896

版权

文章目录

一、VGG16 介绍
二、Keras のVGG16模型应用
- 2.1 模型简介
- 2.2 模型应用
有趣的事，Python永远不会缺席
培训说明

模型与数据 https://blog.csdn.net/u010986753/article/details/98526886

一、VGG16 介绍

1.1 VGG の结构配置

VGG中根据卷积核大小和卷积层数目的不同，可分为A，A-LRN,B,C,D,E共6个配置(ConvNet Configuration)，其中以D,E两种配置较为常用，分别称为VGG16和VGG19。

A：是最基本的模型，8个卷基层，3个全连接层，一共11层。
A-LRN：忽略
B：在A的基础上，在stage1和stage2基础上分别增加了1层3X3卷积层，一共13层。
C：在B的基础上，在stage3，stage4和stage5基础上分别增加了一层1X1的卷积层，一共16层。
D：在B的基础上，在stage3，stage4和stage5基础上分别增加了一层3X3的卷积层，一共16层。
E：在D的基础上，在stage3，stage4和stage5基础上分别增加了一层3X3的卷积层，一共19层。

模型D是就是经常说的VGG16网络，模型E则为VGG19网络下图给出了VGG的六种结构配置：

上图中，每一列对应一种结构配置。例如，图中绿色部分即指明了 VGG16 所采用的结构。

我们针对VGG16进行具体分析发现，VGG16共包含：

13个卷积层（Convolutional Layer），分别用conv3-XXX表示
3个全连接层（Fully connected Layer）,分别用FC-XXXX表示
5个池化层（Pool layer）,分别用maxpool表示
其中，卷积层和全连接层具有权重系数，因此也被称为权重层，总数目为13+3=16，这即是VGG16中16的来源。(池化层不涉及权重，因此不属于权重层，不被计数)。

1.2 VGG16 の结构特点

卷积层均采用相同的卷积核参数

卷积层均表示为conv3-XXX，其中conv3说明该卷积层采用的卷积核的尺寸(kernel size)是3，即宽（width）和高（height）均为3，3*3是很小的卷积核尺寸，结合其它参数（步幅stride=1，填充方式padding=same），这样就能够使得每一个卷积层(张量)与前一层（张量）保持相同的宽和高。XXX代表卷积层的通道数。

池化层均采用相同的池化核参数

池化层的参数均为2×2，步幅stride=2，max的池化方式，这样就能够使得每一个池化层（张量）的宽和高是前一层（张量）的12。

模型是由若干卷积层和池化层堆叠（stack）的方式构成，比较容易形成较深的网络结构（在2014年，16层已经被认为很深了）。

综合上述分析，可以概括VGG的优点为: Small filters, Deeper networks

下图给出了VGG16的具体结构示意图：

1.3 VGG16 の块结构

VGG16的卷积层和池化层可以划分为不同的块（Block），从前到后依次编号为Block1~block5。每一个块内包含若干卷积层和一个池化层。
VGG16的输入图像是224×224×3的图像张量(tensor),随着层数的增加，后一个块内的张量相比于前一个块内的张量：
通道数翻倍，由64依次增加到128，再到256，直至512保持不变，不再翻倍
高和宽变减半，由224→ 112→ 56→28→ 14→ 7
每一个块内包含若干卷积层和一个池化层。并且同一块内，卷积层的通道（channel）数是相同的，

block1中包含2个卷积层，每个卷积层用conv3-64表示,即卷积核为：3×3，通道数都是64,卷积核有64个,
共有[输入通道3×卷积核（3 × 3）]× 卷积和通道64 = 1728个参数。
共有[输入通道64×卷积核（3 × 3）]× 卷积和通道64 = 36864个参数。
输入224×224×3，2卷积后224×224×64，池化输出：112×112×64
block2中包含2个卷积层，每个卷积层用conv3-128表示,即卷积核为：3×3，通道数都是128，
共有[输入通道64×卷积核（3 × 3）]× 卷积和通道128 = 73728个参数。
共有[输入通道128×卷积核（3 × 3）]× 卷积和通道128 = 147456个参数。
输入112×112×64，2卷积后112×112×128，池化输出：56×56×128
block3中包含3个卷积层，每个卷积层用conv3-256表示,即卷积核为：3×3，通道数都是256，
共有[输入通道128×卷积核（3 × 3）]× 卷积和通道256 = 294912个参数。
共有[输入通道256×卷积核（3 × 3）]× 卷积和通道256 = 589824个参数。
共有[输入通道256×卷积核（3 × 3）]× 卷积和通道256 = 589824个参数。
输入56×56×128，3卷积后56×56×256，池化输出：28×28×256
Block4中包含3个卷积层，每个卷积层用conv3-512表示,即卷积核为：3×3，通道数都是512，
共有[输入通道256×卷积核（3 × 3）]× 卷积和通道512 = 1179648个参数。
共有[输入通道512×卷积核（3 × 3）]× 卷积和通道512 = 2359296个参数。
共有[输入通道512×卷积核（3 × 3）]× 卷积和通道512 = 2359296个参数。
输入28×28×256，3卷积后28×28×512，池化输出：14×14×512
block5中包含3个卷积层，每个卷积层用conv3-512表示,即卷积核为：3×3，通道数都是512，
共有[输入通道512×卷积核（3 × 3）]× 卷积和通道512 = 2359296个参数。
共有[输入通道512×卷积核（3 × 3）]× 卷积和通道512 = 2359296个参数。
共有[输入通道512×卷积核（3 × 3）]× 卷积和通道512 = 2359296个参数。
输入14×14×512，3卷积后14×14×512，池化输出：7×7×512

下面给出按照块划分的VGG16的结构图

1.4 VGG16 の权重参数

对于第一层卷积，由于输入图的通道数是3，网络必须学习大小为3×3，通道数为3的的卷积核，这样的卷积核有64个，因此总共有（3×3 × 3）× 64 = 1728个参数。
全连接层权重参数为：前一层节点数×本层的节点数
FC(1×1×4096)参数:7×7×512×4096=102760448，memory4096
FC(1×1×4096)参数:4096×4096=16777216，memory4096
FC(1×1×1000)参数：4096×1000=4096000，memory1000

整个网络的全部参数的计算过程（不考虑偏置）,图中蓝色是计算权重参数数量的部分；红色是计算所需存储容量的部分。

1.5 VGG16 の缺点

VGG16具有如此之大的参数数目，可以预期它具有很高的拟合能力；但同时缺点也很明显：

即训练时间过长，调参难度大。
需要的存储容量大，不利于部署。例如存储VGG16权重值文件的大小为500多MB，不利于安装到嵌入式系统中。

二、Keras のVGG16模型应用

2.1 模型简介

Keras是一个高层神经网络API,Keras由纯Python编写，是tensorflow和Theano等底层深度学习库的高级封装。使用Keras时，我们不需要直接调用底层API构建深度学习网络，仅调用keras已经封装好的函数即可。

额外说明

程序运行过程中，语句model = VGG16(weights=‘imagenet’, include_top=True)会下载已经训练好的文件到c:<使用者>.keras\models文件夹下，模型的文件名为vgg16_weights_tf_dim_ordering_tf_kernels.h5,大小为527MB
语句pred=decode_predictions(features, top=5)[0]会下载分类信息文件到c:<使用者>.keras\models文件夹下，模型的文件名为imagenet_class_index.json,该文件指明了ImageNet大赛所用的1000个图像类的信息。（由于下载地址在aws上，需要科学上网，梯子请自备）
程序运行结束，会在工作目录下生成测试图片的预测图，给出了最有可能的前5个类列。名称为：测试文件名_pred.png
include_top=True，表示会载入完整的 VGG16 模型，包括加在最后3层的卷积层；include_top=False，表示会载入 VGG16 的模型，不包括加在最后3层的卷积层，通常是取得 Features
为了避免c盘占用过大，使用相对路径加载也可以
path=’./[权重文件存放路径]/vgg16_weights_tf_dim_ordering_tf_kernels.h5’
vgg16 = VGG16(weights=path, include_top=True)
vgg16.summary()

2.2 模型应用

# coding = utf-8
# 通过调用Keras中已有的模型对三幅测试图片进行测试，验证了VGG16在图片分类分类任务上的优异表现。
import matplotlib.pyplot as plt
from keras.applications.vgg16 import VGG16,preprocess_input,decode_predictions
from keras

最低0.47元/天解锁文章

小麦粒

关注

8
点赞
踩
33

收藏

觉得还不错? 一键收藏
1
评论
keras—VGG16

VGG16共包含：13个卷积层（Convolutional Layer），分别用conv3-XXX表示3个全连接层（Fully connected Layer）,分别用FC-XXXX表示5个池化层（Pool layer）,分别用maxpool表示其中，卷积层和全连接层具有权重系数，因此也被称为权重层，总数目为13+3=16，这即是VGG16中16的来源。(池化层不涉及权重，因此不属于权重层，不被计数)。
复制链接

扫一扫

专栏目录