利用ImageNet上预训练的VGG19提取图像特征

迷茫的小张_

已于 2023-09-14 12:01:28 修改

阅读量524

点赞数 1

文章标签：深度学习人工智能

于 2023-09-14 11:55:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzcy202202/article/details/132872945

版权

本文介绍了VGG19卷积神经网络的结构，它在ILSVRC比赛中取得了优异成绩。通过VGG16为例，详细阐述了网络层的配置，包括卷积和池化层。接着，讨论了如何利用TensorFlow构建网络并提取特定层的特征，特别是去掉最后一层softmax，使用预训练权重文件。在实际操作中遇到了关于tf.split函数版本问题的解决办法，并提供了相关代码仓库和模型下载链接。

摘要由CSDN通过智能技术生成

VGG卷积神经网络是牛津大学在2014年提出来的模型。当这个模型被提出时，由于它的简洁性和实用性，马上成为了当时最流行的卷积神经网络模型。它在图像分类和目标检测任务中都表现出非常好的结果。在2014年的ILSVRC比赛中，VGG 在Top-5中取得了92.3%的正确率。有VGG16和VGG19，模型的权重由ImageNet训练而来。

1、VGG结构

下面以VGG16为例来说明：

看出VGG16由13个卷积层+3个全连接层=16层构成，过程为：

经过的卷积核大小为333，stride=1，padding=1，pooling为采用2x2的max pooling方式。

(1) 输入：输入224 * 224 * 3的图片。

(2) Conv1_1+conv1_2+pool1：经过64个卷积核的两次卷积后，采用一次max pooling。经过第一次卷积后，有(3 * 3 * 3) * 64=1728个训练参数；第二次卷积后，有(3 * 3 * 64) * 64=36864个训练参数，大小变为112 * 112 * 64.

(3) Conv2_1+conv2_2+pool2：经过两次128个的卷积核卷积之后࿰

最低0.47元/天解锁文章

迷茫的小张_

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
利用ImageNet上预训练的VGG19提取图像特征

(5) Conv4_1+conv4_2+con4_3+pool4: 经过三次512个的卷积核卷积之后，采用一次max pooling，有(3 * 3 * 512) * 512=2359296个训练参数，大小变为14 * 14 * 512.(6) Conv5_1+conv5_2+con5_3+pool5: 再经过三次512个的卷积核卷积之后，采用一次max pooling，有(3 * 3 * 512) * 512=2359296个训练参数，大小变为7 * 7 * 512.
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。