使用pytorch搭建VGG网络

最新推荐文章于 2024-07-24 11:21:28 发布

Action_now_z

最新推荐文章于 2024-07-24 11:21:28 发布

阅读量1.3k

点赞数 2

分类专栏： pytorch cnn经典模型文章标签：深度学习

本文链接：https://blog.csdn.net/Action_now_zj/article/details/109250528

版权

该博客介绍了如何使用PyTorch搭建VGG网络，详细讲述了VGG模型的结构特点，包括只使用3X3滤波器以减少参数并保持功能，以及在每个最大池化层后滤波器数量翻倍。博主还分享了训练过程，使用了数据增强和批量梯度下降法，并给出了训练损失和测试准确率的变化情况。

摘要由CSDN通过智能技术生成

首先，引入CNN感受野

其次，VGG整体框架如下：

每层的卷积层stride=1,padding=1；池化层也一样的结构

VGG论文要点：

仅使用3X3滤波器，这与之前的AlexNet的首层11X11滤波器、ZF Net的7X7滤波器都大不相同。作者所阐述的理由是，两个3X3的卷积层结合起来能够生成一个有效的5X5感知区。因此使用小尺寸滤波器既能保持与大尺寸相同的功能又保证了小尺寸的优势。优势其中之一就是参量的减少，另一个优势在于，针对两个卷积网络我们可以使用多一个线性整流层ReLU。

3个3X3卷积层并排起来相当于一个有效的7X7感知区。

输入图像的空间尺寸随着层数增加而减少（因为通过每层的卷积或是池化操作），其深度反而随着滤波器越来越多而增加。

一个有趣的现象是，每个最大池化层之后，滤波器数量都翻倍，这进一步说明了数据的空间尺寸减少但深度增加。

模型不仅对图像分类有效，同样能很好地应用在本地化任务中。作者在文章中进行了一系列的回归分析说明此事。

用Caffe工具箱进行建模

在训练中使用了尺寸抖动技术scale jittering进行数据扩容data augmentation

每卷积层后紧跟一个线性整流层ReLU并使用批量梯度下降法batch gradient descent进行训练

用4块Nvidia Titan Black GPU进行训练2~3周。

github代码 pytorch搭建经典网络模型

数据集 http://download.tensorflow.org/example_images/flower_photos.tgz

将数据集执行split_data.py脚本自动将数据集划分成训练集train和验证集val

|—— flower_data
|———— flower_photos（解压的数据集文件夹，3670个样本）
|———— train（生成的训练集，3306个样本）
|———— val（生成的验证集，364个样本）

1.model.py 创建网络架构

import torch.nn as nn
import torch


class VGG(nn.Module):
    def __init__(self, features, num_classes=1000, init_weights=False):
        super(VGG, self).__init__()
        self.features = features
        self.classifier = nn.Sequential(
            nn.Dropout(p=0.5),
            nn.Linear(512*7*7, 2048),
            nn.ReLU(True),
            nn.Dropout(p=0.5),
            nn.Linear(2048, 2048),
            nn.ReLU(True),
            nn.Linear(2048, num_classes)
        )
        if init_weights:
            self._initialize_weights()

    def forward(self, x):
        # N x 3 x 224 x 224
        x = self.features(x)
        # N x 512 x 7 x 7
        x = torch.flatten(x, start_dim=1)
        # N x 512*7*7
        x = self.classi