卷积神经网络3——VGG(使用块的网络)(ImageNet-2014 NO.2)

虽然AlexNet证明深层神经网络卓有成效,但它没有提供一个通用的模板来指导后续的研究人员设计新的网络。于是出现了使用块的思想,通过使用循环和子程序,可以很容易地在任何现代深度学习框架的代码中实现这些重复的架构。
VGGNet网络结构简洁,迁移到其他图片数据上的泛化性能非常好。VGGNet现在依然经常被用来提取图像特征,该网络训练后的模型参数在其官网上开源了,可以用来在图像分类任务上进行在训练,即:提供了非常好的初始化权重,使用较为广泛。

一个VGG块与经典卷积神经网络的基本组成部分类似,由一系列卷积层组成,后面再加上用于空间下采样的最大池化层。在最初的VGG论文中,作者使用了带有3×3卷积核、填充为1(保持高度和宽度)的卷积层,和带有2×2池化窗口、步幅为2(每个块后的分辨率减半)的最大池化层。

  • 一个大卷积核分解成连续多个小卷积核
    • 核分解: 7x7核 → 3个3x3核(由ReLU连接)
    • 参数数量: 49C² → 27C²
  • 减少参数,降低计算,增加深度
  • 继承AlexNet结构特点:简单,有效

为什么选择带有3×3卷积核、填充为1(保持高度和宽度)的卷积层,而不是5×5卷积核、填充为2呢?
同样的计算量下,更多的3X3计算比少量的5X5计算更好, 再进一步说,2个3X3卷积层的感受野等于5X5卷积层的感受野,且训练参数更少,网络更深且窄。(便宜且效果好)

与AlexNet、LeNet一样,VGG网络可以分为两部分:第一部分主要由卷积层和池化层组成,第二部分由全连接层组成。如下图中所示。
在这里插入图片描述
在这里插入图片描述

  • VGG-11使用可复用的卷积块构造网络。不同的VGG模型可通过每个块中卷积层数量和输出通道数量的差异来定义。
  • 块的使用使得网络定义的非常简洁。使用块可以有效地设计复杂的网络。
  • 我们发现深层且窄的卷积(即3×3)比较浅层且宽的卷积更有效。
  • 不同的超参数可以得到不同复杂度的变种。
  • 三类网络对比:

LeNet:2卷积+池化/2全连接

AlexNet:更大更深的LeNet,ReLU+Dropout+数据增强

VGG:更大更深的AlexNet,重复的VGG块

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Imagenet-vgg-verydeep-19.mat是一个预训练的深度神经网络模型文件,包含了一个19层的卷积神经网络CNN)模型,在计算机视觉领域中非常有用。它被称为VGG-19,因为它由两个重复的卷积层阶段组成,每个阶段包含了4个卷积层和2个池化层,加上3个全连接层。此模型是由牛津大学计算机科学系Visual Geometry Group团队开发的,用于2014ImageNet图像分类竞赛中取得了第二名的成绩。 下载Imagenet-vgg-verydeep-19.mat模型文件可以方便地使用它进行迁移学习和特征提取,将已经训练好的模型用于类似的计算机视觉任务,例如图像分类、物体检测、图像分割等。在许多研究领域,它已经成为使用深度学习进行计算机视觉最常使用的模型之一。 需要注意的是,Imagenet-vgg-verydeep-19.mat是一个很大的文件(约几百MB),下载它可能需要一些耐心和时间,特别是在网络环境较为缓慢的情况下。此外,该模型是使用MATLAB语言编写的,因此如果你想在其他编程语言中使用该模型,需要进行一些额外的工作来将其转化为其他语言所能识别的格式。 ### 回答2: imagenet-vgg-verydeep-19.mat是一个神经网络模型,它是基于VGG网络架构的一个深度神经网络。它是在2014年ILSVRC比赛中,由Visual Geometry Group (VGG)的研究人员提出的一种高效的CNN模型,该模型在“image classification”(图像分类)任务上的表现相当惊人,打破了当时的记录。它在准确性和速度方面表现出色,因此它得到了广泛的应用,成为深度学习领域的研究者和开发者们常用的模型之一。 imagenet-vgg-verydeep-19.mat是该模型的一个预训练权重文件,其中包含了30多万个图像的标识符和与之相应的特征描述符。这些权重可用于快速训练您自己的图片分类器或其他深度学习任务,这比从头开始训练一个完整的神经网络要快得多。您也可以使用这些权重来对一些图像进行分类,并使用它们的特征描述符来进行特征提取和图像检索。 如果您想要使用imagenet-vgg-verydeep-19.mat文件,您需要先下载它并存储到您的本地计算机中。在MATLAB中,您可以使用以下命令来下载该文件: ``` urlwrite('http://www.vlfeat.org/matconvnet/models/imagenet-vgg-verydeep-19.mat', 'imagenet-vgg-verydeep-19.mat'); ``` 下载完成后,您可以将其导入到MATLAB环境中,使用它进行图像分类和特征提取。该文件的大小约为500MB,因此请确保您的计算机具有足够的存储空间和足够的RAM来使用它。 ### 回答3: Imagenet-vgg-verydeep-19.mat是一个预训练的深度神经网络的模型文件,可以用来在计算机视觉领域进行图像分类、目标检测等诸多任务。该模型主要基于VGG网络结构,是一种具有较好性能和广泛应用的深度卷积神经网络。 下载Imagenet-vgg-verydeep-19.mat文件可以帮助研究人员或开发人员更快地开发和实现计算机视觉的应用程序。在某些应用场景下,为了实现对图像的识别或分类,需要大量的数据和计算资源。使用预训练的模型可以节省很多时间和计算资源,同时也可以提高模型的准确度。 目前,Imagenet-vgg-verydeep-19.mat模型已经被广泛应用于图像分类、目标检测和语义分割等领域。可以作为图像识别算法的基础模型,进行相应的改进和优化,从而得到更高的精度和更好的效果。 需要注意的是,使用Imagenet-vgg-verydeep-19.mat文件时,需要具备一定的深度学习算法和编程技能,否则很难实现相关应用。同时,也需要具备一定的数据处理能力,针对不同的应用场景,对数据进行适当的预处理和增强,才能得到更优的模型效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值