pytorch深度学习代码阅读(0):总论

最新推荐文章于 2023-05-10 19:37:54 发布

MaXuwl

最新推荐文章于 2023-05-10 19:37:54 发布

阅读量259

点赞数

分类专栏：阅读代码文章标签： pytorch

本文链接：https://blog.csdn.net/MaXumr/article/details/107713937

版权

阅读代码专栏收录该内容

2 篇文章 0 订阅

订阅专栏

转载请注明出处
个人博客:https://maxusun.github.io/

这几天进入实验室后，开始阅读实验室学姐的一份代码。刚到手的时候像一个烫手的山芋，不知道从哪里下手，而将整个项目的代码阅读完之后，发现在这个过程中能学到很多东西。于是便想将整个过程记录下来，便于学习。

在阅读前不能傻乎乎的埋头就开始一行一行读。首先应该先对代码进行分块。粗略的说，可以分成四块：

数据加载和预处理
神经网络实现
训练网络
其他(工具,配置文件,过程记录等)

数据加载和预处理

训练神经网络最重要的就是数据。数据预处理包括下面几点：

实现一个Dataset加载自己的数据
为了使用DataLoader加载数据。我们需要自己实现一个Dataset对数据处理。对数据的一些预处理，如：裁剪、拉伸、旋转、镜像等处理，都是在这个模块中实现。在看这个模块的时候主要看下面几个函数：
- __init__(self,prams)：初始化函数，prams是用户自己传入的参数，像文件路径啊，裁剪时图片的大小呀之类的。主要是对用到的变量初始化。
- __getitem__(self, index)：DataLoader通过调用Dataset的这个函数来读取数据，其中index是指调用哪个数据。一般在这个函数调用处理数据的函数，返回值是data和label。
- __len__(self)：返回数据集中一共有多少个数据。
对数据的预处理
在一些项目中，并不是直接把数据(图片)送到神经网络中训练，通常要对其处理，像裁剪、拉伸、上采样、下采样、随机旋转图片、随机旋转RGB通道、随机镜像等。这些方法一般放在Dataset中实现，或者实现一个data_util专门处理这些。

神经网络实现

神经网络这一块没有什么好说的，一般都是根据论文给的结构实现的。但是一定要多看看一些经典的或者复杂的神经网络是怎样实现的，比如：Resnet，Unet，Fast-RNN等这些不同领域典型网络的实现。

训练网络

训练网络部分的代码也比较复杂，因为这里面涉及到配置加载，断点保存等。看这部分代码的时候，首先找几行重要的代码。在这几行代码之间穿插着作者实现的其他代码。首先我们先找到train函数，如果代码里面有evaluate和predict函数，都是差不多的。

def train(param_set):
    model = OurNet(parms)                               # 1. 初始化模型
    # 这中间的代码一般都是配置文件
    criterion = nn.CrossEntropyLoss()                   # 2. 定义损失函数和优化器
    optimizer = Adam(model.parameters(),lr=5e-4)
    # 这中间如果有代码也是配置文件之类的
    loader = DataLoader(xxxxxxx)                        # 3. 使用DataLoader加载数据
    # 这里有代码也是配置文件或者打印信息之类的
    for epoch in range(num_epochs):                     # 4. 每个epoch算是训练数据一次
        for step,(data1,data2,…) in enumerate(loader):  # 5. 每一步都加载一个batch的数据
            # 可能会有是否使用GPU的代码
            outputs = model(data1,data2,…)              # 6. 得到输出
            # 这中间的代码一般都是计算、打印、保存 loss、acc、dice等
            # 或者保存当前训练的状态
            optimizer.zero_grad()                       # 7. 梯度归零、反向传播、优化参数等
            loss.backward()
            optimizer.step()
            # 保存model的一些代码
        # 每个epoch结束后计算平均loss、acc、dice等指标并保存