【Pytorch深度学习实战】（5）卷积神经网络（CNN）-CSDN博客

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎

📝个人主页－Sonhhxg_柒的博客_CSDN博客 📃

🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝

📣系列专栏 - 机器学习【ML】自然语言处理【NLP】深度学习【DL】

🖍foreword

✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。

如果你对这个系列感兴趣的话，可以关注订阅哟👋

卷积神经网络（Convolutional Neural Network, CNN）

CNN 是一种前馈神经网络，通常由一个或多个卷积层（Convolutional Layer）和全连接层（Fully Connected Layer，对应经典的 NN）组成，此外也会包括池化层（Pooling Layer）。

CNN 的结构使得它易于利用输入数据的二维结构。

注意：前馈神经网络（Feedforward NN）指每个神经元只与前一层的神经元相连，数据从前向后单向传播的 NN。其内部结构不会形成有向环（对比后面要讲到的 RNN/LSTM）。它是最早被发明的简单 NN 类型，前面讲到的 NN、DNN 都是前馈神经网络。

每个卷积层由若干卷积单元组成——可以想象成经典 NN 的神经元，只不过激活函数变成了卷积运算。

卷积运算是有其严格的数学定义的。不过在 CNN 的应用中，卷积运算的形式是数学中卷积定义的一个特例，它的目的是提取输入的不同特征。

一般情况下，从直观角度来看，CNN 的卷积运算，就是下图这样：

上图中左侧的蓝色大矩阵表示输入数据，在蓝色大矩阵上不断运动的绿色小矩阵叫做卷积核，每次卷积核运动到一个位置，它的每个元素就与其覆盖的输入数据对应元素相乘求积，然后再将整个卷积核内求积的结果累加，结果填注到右侧红色小矩阵中。卷积核横向每次平移一列，纵向每次平移一行。最后将输入数据矩阵完全覆盖后，生成完整的红色小矩阵就是卷积运算的结果。

CNN 经常被用于处理图像，那么对应的输入数据就是一张图片的像素信息。

对于这样的输入数据，第一层卷积层可能只能提取一些低级的特征，如边缘、线条、角等，更多层的网络再从低级特征中迭代提取更复杂的特征。

CNN 结构相对简单，可以使用反向传播算法进行训练，这使它成为了一种颇具吸引力的深度学习网络模型。

除了图像处理，CNN 也会被应用到语音、文本处理等其他领域。

卷积神经网络Pytorch的实现


  
  
    
    
     
     
    
    
    
    
     
     
      
      import torch 
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      import torch.nn 
      
      as nn
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      import torchvision
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      import torchvision.transforms 
      
      as transforms
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # 设备配置
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      device 
      
      = torch.device(
      
      'cuda:0' 
      
      if torch.cuda.
      
      is_available() 
      
      else 
      
      'cpu')
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # 超参数
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      num_epochs 
      
      = 
      
      5
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      num_classes 
      
      = 
      
      10
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      batch_
      
      size 
      
      = 
      
      100
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      learning_rate 
      
      = 
      
      0.001
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # MNIST 数据集
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      train_dataset 
      
      = torchvision.datasets.MNIST(root
      
      =
      
      '../../data/',
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                 train
      
      =
      
      True, 
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                 transform
      
      =transforms.ToTensor(),
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                 download
      
      =
      
      True)
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      test_dataset 
      
      = torchvision.datasets.MNIST(root
      
      =
      
      '../../data/',
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                train
      
      =
      
      False, 
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                transform
      
      =transforms.ToTensor())
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # 数据加载器
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      train_loader 
      
      = torch.utils.
      
      data.DataLoader(dataset
      
      =train_dataset,
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                 batch_
      
      size
      
      =batch_
      
      size, 
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                 shuffle
      
      =
      
      True)
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      test_loader 
      
      = torch.utils.
      
      data.DataLoader(dataset
      
      =
      
      test_dataset,
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                batch_
      
      size
      
      =batch_
      
      size, 
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                                                shuffle
      
      =
      
      False)
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # 卷积神经网络（两个卷积层）
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      class ConvNet(nn.Module):
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
          def __init__(
      
      self, num_classes
      
      =
      
      10):
     
     
    
    

    
    
     
     
    
    
    
    
     
             
      
      super(ConvNet, 
      
      self).__init__()
     
     
    
    

    
    
     
     
    
    
    
    
     
             
      
      self.layer
      
      1 
      
      = nn.
      
      Sequential(
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  nn.Conv
      
      2d(
      
      1, 
      
      16, kernel_
      
      size
      
      =
      
      5, stride
      
      =
      
      1, padding
      
      =
      
      2),
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  nn.BatchNorm
      
      2d(
      
      16),
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  nn.ReLU(),
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  nn.MaxPool
      
      2d(kernel_
      
      size
      
      =
      
      2, stride
      
      =
      
      2))
     
     
    
    

    
    
     
     
    
    
    
    
     
             
      
      self.layer
      
      2 
      
      = nn.
      
      Sequential(
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  nn.Conv
      
      2d(
      
      16, 
      
      32, kernel_
      
      size
      
      =
      
      5, stride
      
      =
      
      1, padding
      
      =
      
      2),
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  nn.BatchNorm
      
      2d(
      
      32),
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  nn.ReLU(),
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  nn.MaxPool
      
      2d(kernel_
      
      size
      
      =
      
      2, stride
      
      =
      
      2))
     
     
    
    

    
    
     
     
    
    
    
    
     
             
      
      self.fc 
      
      = nn.Linear(
      
      7
      
      *
      
      7
      
      *
      
      32, num_classes)
     
     
    
    

    
    
     
     
    
    
    
    
     
             
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
          def forward(
      
      self, x):
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              out 
      
      = 
      
      self.layer
      
      1(x)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              out 
      
      = 
      
      self.layer
      
      2(out)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              out 
      
      = out.reshape(out.
      
      size(
      
      0), -
      
      1)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              out 
      
      = 
      
      self.fc(out)
     
     
    
    

    
    
     
     
    
    
    
    
     
             
      
      return out
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      model 
      
      = ConvNet(num_classes).
      
      to(device)
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # 损失和优化器
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      criterion 
      
      = nn.CrossEntropyLoss()
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      optimizer 
      
      = torch.optim.Adam(model.parameters(), lr
      
      =learning_rate)
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # 训练模型
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      total_step 
      
      = len(train_loader)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      for epoch 
      
      in range(num_epochs):
     
     
    
    

    
    
     
     
    
    
    
    
     
         
      
      for i, (images, labels) 
      
      in enumerate(train_loader):
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              images 
      
      = images.
      
      to(device)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              labels 
      
      = labels.
      
      to(device)
     
     
    
    

    
    
     
     
    
    
    
    
     
             
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              # 前向传播
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              outputs 
      
      = model(images)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              loss 
      
      = criterion(outputs, labels)
     
     
    
    

    
    
     
     
    
    
    
    
     
             
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              # 向后优化
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              optimizer.
      
      zero_grad()
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              loss.backward()
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              optimizer.step()
     
     
    
    

    
    
     
     
    
    
    
    
     
             
     
     
    
    

    
    
     
     
    
    
    
    
     
             
      
      if (i
      
      +
      
      1) % 
      
      100 
      
      =
      
      = 
      
      0:
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                  print (
      
      'Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}' 
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
                         .
      
      format(epoch
      
      +
      
      1, num_epochs, i
      
      +
      
      1, total_step, loss.item()))
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # 测试模型
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      model.eval()  # eval 
      
      mode (batchnorm uses moving mean
      
      /variance instead 
      
      of mini-batch mean
      
      /variance)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      with torch.
      
      no_grad():
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
          correct 
      
      = 
      
      0
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
          total 
      
      = 
      
      0
     
     
    
    

    
    
     
     
    
    
    
    
     
         
      
      for images, labels 
      
      in 
      
      test_loader:
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              images 
      
      = images.
      
      to(device)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              labels 
      
      = labels.
      
      to(device)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              outputs 
      
      = model(images)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              _, predicted 
      
      = torch.max(outputs.
      
      data, 
      
      1)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              total 
      
      +
      
      = labels.
      
      size(
      
      0)
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
              correct 
      
      +
      
      = (predicted 
      
      =
      
      = labels).
      
      sum().item()
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
          print(
      
      'Test Accuracy of the model on the 10000 test images: {} %'.
      
      format(
      
      100 
      
      * correct 
      
      / total))
     
     
    
    

    
    
     
     
    
    
    
    
     
      
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      # 保存模型
     
     
    
    

    
    
     
     
    
    
    
    
     
     
      
      torch.save(model.state_dict(), 
      
      'model.ckpt')