【PyTorch学习-2】PyTorch高级操作|PyTorch生态系统相关工具|深度学习中的常用技巧|动态计算图与Autograd机制|模型调试与检查|分布式训练与并行计算|实用工具和技巧...

985小水博一枚呀

已于 2024-10-09 17:36:45 修改

阅读量376

点赞数 15

分类专栏：学习笔记文章标签：深度学习 pytorch 学习人工智能 python 神经网络

于 2024-10-09 17:21:29 首次发布

本文链接：https://blog.csdn.net/gaoxiaoxiao1209/article/details/142743623

版权

学习笔记专栏收录该内容

63 篇文章 0 订阅

订阅专栏

【PyTorch学习-2】PyTorch高级操作|PyTorch生态系统相关工具|深度学习中的常用技巧|动态计算图与Autograd机制|模型调试与检查|分布式训练与并行计算|实用工具和技巧…

文章目录

【PyTorch学习-2】PyTorch高级操作|PyTorch生态系统相关工具|深度学习中的常用技巧|动态计算图与Autograd机制|模型调试与检查|分布式训练与并行计算|实用工具和技巧...
前言
1. PyTorch高级操作
2. PyTorch生态系统相关工具

欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！
祝所有的硕博生都能遇到好的导师！好的审稿人！好的同门！顺利毕业！

访问艾思科蓝官网，浏览2024年即将召开的学术会议列表。会议入口：https://ais.cn/u/mmmiUz

前言

继续扩展PyTorch学习中的常用语法、函数和搭建深度学习神经网络常用的库和函数，以下是更深入的一些内容，涵盖了更多高级操作、实用工具以及相关的生态工具和技巧。涵盖更复杂的场景和使用技巧，以及一些常用的进阶方法与实践。

1. PyTorch高级操作

1.1 自定义Dataset

对于自定义的数据集，PyTorch 提供了 torch.utils.data.Dataset 类。通过继承该类，可以自定义数据集的读取和处理方式，尤其在处理非标准化的数据时。

自定义数据集示例

from torch.utils.data import Dataset

class CustomDataset(Dataset):
    def __init__(self, data, labels, transform=None):
        self.data = data
        self.labels = labels
        self.transform = transform

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        sample = self.data[idx]
        label = self.labels[idx]
        if self.transform:
            sample = self.transform(sample)
        return sample, label

# 假设data和labels已经定义
custom_dataset = CustomDataset(data, labels)

解释：在自定义数据集中，__len__()返回数据集的大小，__getitem__()定义了如何获取每一个样本的数据和标签。可以根据需求添加数据变换（transform）操作。

1.2 梯度累积（Gradient Accumulation）

当GPU显存不足以容纳一个大的batch时，可以通过梯度累积的方式来训练模型，即多次计算梯度累加，然后再进行一次优化器的更新。

梯度累积示例

accumulation_steps = 4  # 累积的步数
optimizer.zero_grad()

for i, (input, target) in enumerate(dataloader):
    output = model(input)
    loss = loss_function(output, target)
    loss.backward()  # 反向传播计算梯度

    if (i + 1) % accumulation_steps == 0:  # 每隔一定步数更新一次参数
        optimizer.step()
        optimizer.zero_grad()  # 清空梯度

解释：在梯度累积过程中，loss.backward() 会累积梯度，而不是立即进行优化器更新，直到达到一定的累积步数时才更新参数。

1.3 学习率调度器（Learning Rate Scheduler）

PyTorch 提供了 torch.optim.lr_scheduler 模块来动态调整学习率，可以在训练过程中通过不同策略调整学习率，以提高模型的收敛速度和效果。

学习率调度器示例

from torch.optim.lr_scheduler import StepLR

optimizer = torch.optim.SGD(model.parameters(), lr=0.1)
scheduler = StepLR(optimizer, step_size=10, gamma=0.1)  # 每10个epoch学习率乘以0.1

for epoch in range(100):
    # 训练代码
    scheduler.step()  # 调整学习率

解释：StepLR每经过step_size个epoch后，将学习率乘以gamma。还有其他调度器如ReduceLROnPlateau可以根据验证集损失调整学习率。

1.4 混合精度训练（Mixed Precision Training）

PyTorch 支持使用 torch.cuda.amp 模块进行混合精度训练，以减少显存使用并加快训练速度，尤其是对大规模模型有很大的帮助。

混合精度训练示例

from torch.cuda.amp import autocast, GradScaler

scaler = GradScaler()  # 定义一个缩放器

for input, target in dataloader:
    optimizer.zero_grad()

    with autocast():  # 自动选择浮点精度
        output = model(input)
        loss = loss_function(output, target)

    # 缩放损失反向传播
    scaler.scale(loss).backward()
    scaler.step(optimizer)  # 优化器更新
    scaler.update()  # 更新缩放器

解释：autocast() 自动选择适合的精度，GradScaler 用于缩放梯度以避免数值不稳定问题。混合精度训练可以显著提升训练速度，特别是在使用NVIDIA的Ampere架构的GPU时。

1.5 模型剪枝（Model Pruning）

模型剪枝是减少模型参数和计算量的常用技术。PyTorch通过torch.nn.utils.prune模块实现剪枝操作。

剪枝操作示例

import torch.nn.utils.prune as prune

model = torch.nn.Linear(10, 5)
prune.l1_unstructured(model, name='weight', amount=0.2)  # 对线性层的权重进行L1剪枝

print(list(model.named_parameters()))  # 查看剪枝后的参数

解释：prune.l1_unstructured()对模型的权重进行L1剪枝，amount=0.2表示将20%的权重置为零。PyTorch还支持其他剪枝方式，如结构化剪枝。

2. PyTorch生态系统相关工具

2.1 torchvision（图像处理库）

torchvision 是 PyTorch 的官方视觉库，提供了常用的预训练模型、图像处理工具以及数据增强方法。

预训练模型

import torchvision.models as models

resnet18 = models.resnet18(pretrained=True)  # 加载预训练的ResNet-18模型
resnet18.fc = torch.nn.Linear(512, 10)  # 修改最后一层用于分类10类

解释：torchvision.models 中包含了许多预训练模型，如ResNet、VGG等，预训练模型可以用于迁移学习，将其用于特定任务时只需修改最后几层。

2.2 torchaudio（音频处理库）

torchaudio 提供了对音频数据的处理和加载支持，可以进行音频格式转换、滤波、特征提取等操作。

音频处理示例

import torchaudio

waveform, sample_rate = torchaudio.load('audio.wav')  # 加载音频文件
mfcc = torchaudio.transforms.MFCC()(waveform)  # 提取MFCC特征

解释：torchaudio 可以用于读取音频数据并进行音频特征提取，常用于语音识别、声音分类等任务。

2.3 torchtext（文本处理库）

torchtext 是 PyTorch 的文本处理库，常用于自然语言处理任务，支持数据加载、预处理、词向量加载等功能。

使用torchtext加载IMDB数据集

from torchtext.datasets import IMDB

train_iter, test_iter = IMDB()  # 加载IMDB数据集
for label, line in train_iter:
    print(label, line)

解释：torchtext.datasets 提供了对常用文本数据集的支持，并且可以通过词向量预处理文本数据。

2.4 PyTorch Lightning（简化训练流程）

pytorch-lightning 是一个用于简化 PyTorch 训练流程的高层库，减少了大量重复的代码编写，尤其适合大型项目的组织和管理。

PyTorch Lightning 示例

import pytorch_lightning as pl

class LitModel(pl.LightningModule):
    def __init__(self):
        super(LitModel, self).__init__()
        self.model = torch.nn.Linear(28 * 28, 10)

    def forward(self, x):
        return self.model(x)

    def training_step(self, batch, batch_idx):
        x, y = batch
        loss = torch.nn.functional.cross_entropy(self(x), y)
        return loss

    def configure_optimizers(self):
        return torch.optim.Adam(self.parameters(), lr=0.001)

# 训练模型
from torch.utils.data import DataLoader, random_split
train_loader = DataLoader(train_dataset, batch_size=32)

model = LitModel()
trainer = pl.Trainer(max_epochs=5)
trainer.fit(model, train_loader)