《动手学深度学习》分别使用残差和VGG训练fashion-mnist分类模型

最新推荐文章于 2023-05-17 17:19:56 发布

VIP文章 Nick_Spider

最新推荐文章于 2023-05-17 17:19:56 发布

阅读量1.6k

点赞数 2

分类专栏：机器视觉机器学习 pytorch 文章标签：深度学习卷积残差网络 vgg pytorch

本文链接：https://blog.csdn.net/weixin_39198406/article/details/104599246

版权

图片数据集：fashion-mnist
下载地址：https://pan.baidu.com/s/1AepwYqg_wQhy9y2S4vkL5Q 密码:aqq3
预览：
在这里插入图片描述

使用残差网络训练模型

导入包

import os
import sys
import time
import math
import torch
from torch import nn, optim
import torch.nn.functional as F
import torchvision
from torchvision import transforms
from tqdm import tqdm

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

print(torch.cuda.is_available())

通用类和函数

# 展平图像
class FlattenLayer(torch.nn.Module):
    def __init__(self):
        super(FlattenLayer, self).__init__()
    def forward(self, x): # x shape: (batch, *, *, ...)
        return x.view(x.shape[0], -1)

class GlobalAvgPool2d(nn.Module):
    """
    全局平均池化层
    可通过将普通的平均池化的窗口形状设置成输入的高和宽实现
    """
    def __init__(self):
        super(GlobalAvgPool2d, self).__init__()
    def forward(self, x):
        return F.avg_pool2d(x, kernel_size=x.size()[2:])

残差网络

class Residual(nn.Module): 
    def __init__(self, in_channels, out_channels, use_1x1conv=False, stride=1):
        """
            use_1×1conv: 是否使用额外的1x1卷积层来修改通道数
            stride: 卷积层的步幅, resnet使用步长为2的卷积来替代pooling的作用，是个很赞的idea
        """
        super(Residual, self).__init__()
        self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=1, stride=stride)
        self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, padding=1)
        if use_1x1conv:
            self.conv3 = nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=stride)
        else:
            self.conv3 = None
        self.bn1 = nn.BatchNorm2d(out_channels)
        self.bn2 = nn.BatchNorm2d(out_channels)

    def forward(self, X):
        Y = F.relu(self.bn1(self.conv1(X)))
        Y = self.bn2(self.conv2(Y))
        if self.conv3:
            X = self.conv3(X)
        return F.relu(Y + X)


def resnet_block(in_channels, out_channels, num_residuals, first_block=False):
    '''
    resnet block
    num_residuals: 当前block包含多少个残差块
    first_block: 是否为第一个block
    一个resnet block由num_residuals个残差块组成
    其中第一个残差块起到了通道数的转换和pooling的作用
    后面的若干残差块就是完成正常的特征提取
    '''
    if first_block:
        assert in_channels == out_channels # 第一个模块的输出通道数同输入通道数一致
    blk = []
    for i in range(num_residuals):
        if i == 0 and not first_block:
            blk.append(Residual(in_channels, out_channels, use_1x1conv=True, stride

最低0.47元/天解锁文章

Nick_Spider

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
2
评论
《动手学深度学习》分别使用残差和VGG训练fashion-mnist分类模型

图片数据集：fashion-mnist下载地址：https://pan.baidu.com/s/1AepwYqg_wQhy9y2S4vkL5Q 密码:aqq3预览：导入包import osimport sysimport timeimport mathimport torchfrom torch import nn, optimimport torch.nn.functi...
复制链接

扫一扫