【深度学习】基于PyTorch架构神经网络学习总结（基础概念&基本网络搭建）

不断向上的萝卜

已于 2024-04-14 16:50:29 修改

阅读量1.1k

点赞数 14

分类专栏：机器学习文章标签：深度学习 pytorch 神经网络

于 2024-02-02 10:26:57 首次发布

本文链接：https://blog.csdn.net/weixin_62100318/article/details/135987477

版权

本文详细介绍了基于PyTorch构建神经网络的过程，包括神经网络整体架构、nn.Module的使用、卷积层、池化层、激活函数、线性层和其他层的配置，以及损失函数、优化器的应用。还探讨了模型的保存和加载、GPU训练以及模型验证策略。

摘要由CSDN通过智能技术生成

神经网络整体架构

类似于人体的神经元

神经网络工作原来为层次结构，一层一层的变换数据。如上述示例有4层，1层输入层、2层隐藏层、1层输出层
神经元：数据的量或矩阵的大小，如上述示例中输入层中有三个神经元代表输入数据有3个特征值，输出层有1个神经元表明得到一个结果，若对于分类结果输出层一般有多个神经元
全连接：每一个神经元都与上一层中所有的神经元有关，权重参数矩阵
非线性：使用非线性函数进行数据映射，如max函数等

神经网络的强大之处即使用更多的参数来拟合复杂的数据

nn.Module的使用

利用PyTorch架构使用神经网络模型时，一般是利用torch.nn函数

自定义神经网络框架 | 官方示例：

import torch.nn as nn
import torch.nn.functional as F

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(1, 20, 5)
        self.conv2 = nn.Conv2d(20, 20, 5)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        return F.relu(self.conv2(x))

对于forward函数相对于是用来说明神经网络中的处理过程，如进行卷积运算的次数与类型等，也可以进行简单的数据处理，如下：

import torch
from torch import nn
'''自定义神经网络'''
class NN_Test1(nn.Module):
    def __init__(self):
        super().__init__()

    def forward(self,input):
        output=input+1
        return output

nn_test1=NN_Test1()#实例化类 获得一个对象
x=torch.tensor(1.0)
output=nn_test1(x)
print(output)

卷积层（convolution）

stride参数用于设置卷积核在图像中的运行步数，如果为单个整数则说明横向纵向都是一样的，也可以设置为元组，（H,W）（横向、纵向）默认为1
padding：进行填充

使用示例：

import  torch
import torch.nn.functional as F
input=torch.tensor([[1,2,0,3,1],
                   [0,1,2,3,1],
                   [1,2,1,0,0],
                   [5,2,3,1,1],
                   [2,1,0,1,1]])##输入自定义的二维矩阵
kernel=torch.tensor([[1,2,1],
                     [0,1,0],
                     [2,1,0]])#卷积核
input=torch.reshape(input,(1,1,5,5))
##由于输入的格式为（batchsize，通道数，行数，列数）
kernel=torch.reshape(kernel,(1,1,3,3))

output=F.conv2d(input,kernel,stride=1)
print(output)
output2=F.conv2d(input,kernel,stride=2)
print(output2)

输出效果：