PyTorch FP16模型转换

最新推荐文章于 2025-03-08 00:15:00 发布

初岘

最新推荐文章于 2025-03-08 00:15:00 发布

阅读量2.6k

点赞数 27

文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/weixin_67051070/article/details/141220258

版权

PyTorch FP16模型转换

Q:

pytorch如何将模型转换为fp16？

A:

在 PyTorch 中，将模型转换为 FP16（半精度浮点数）可以通过几种不同的方法实现，最常见的方法是使用 torch.cuda.amp 模块和 torch.nn.Module.half() 方法。下面是一些常用的方法：

方法一：使用 `torch.cuda.amp` 模块

torch.cuda.amp 模块提供了自动混合精度训练的支持，这种方法结合了 FP32（单精度浮点数）和 FP16 的优点。以下是一个示例：

import torch
import torch.nn as nn
import torch.optim as optim
from torch.cuda.amp import autocast, GradScaler

# 定义模型
model = nn.Sequential(
    nn.Linear(10, 10),
    nn.ReLU(),
    nn.Linear(10, 1)
).cuda()

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 创建一个 GradScaler 对象
scaler = GradScaler()

# 示例数据
inputs = torch.randn(16, 10).cuda()
targets = torch.randn(16, 1).cuda()

# 训练步骤
for epoch in range(10):
    optimizer.zero_grad()
    
    # 使用 autocast 进行前向传播
    with autocast():
        outputs = model(inputs)
        loss = criterion(outputs, targets)
    
    # 使用 scaler 进行反向传播和优化
    scaler.scale(loss).backward()
    scaler.step(optimizer)
    scaler.update()
    
    print(f'Epoch {
     epoch+1}, Loss: {
     loss.item()}')

方法二：使用 `torch.nn.Module.half()`

如果你希望整个模型都转换为 FP16，可以使用 half() 方法。这种方法比较简单，但需要确保所有输入数据也转换为 FP16。

import torch
import torch.nn as nn
import torch.optim as optim

# 定义模型
model = nn.Sequential(
    nn.Linear(10, 10),
    nn.ReLU(),
    nn.Linear(10, 1)
).cuda()

# 将模型转换为 FP16
model.half()

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 示例数据
inputs = torch.randn(16, 10).cuda().half()
targets = torch.randn(16, 1).cuda().half()

# 训练步骤
for epoch in range(10):
    optimizer.zero_grad()
    
    # 前向传播
    outputs = model(inputs)
    loss = criterion(outputs, targets)
    
    # 反向传播和优化
    loss.backward()
    optimizer.step()
    
    print(f'Epoch {
     epoch+1}, Loss: {
     loss.item()}')