pytorch + AMD卡 (docker快速构建A卡pytorch环境, 5分钟不折腾版)

环境

  • 宿主机环境
    ubuntu20.02(其实能跑docker的linux都可以)
    CPU: AMD Ryzen 9 5950X
    GPU: AMD 6700XT 12G

    理论上可以支持绝大部分的A卡 包含570 580

  • 容器环境
    ROCm5.0
    pytorch1.10.0
    python3.7

启动容器

docker run \
    --device=/dev/kfd \
    --device=/dev/dri \
    --cap-add=SYS_PTRACE \
    --security-opt seccomp=unconfined \
    --ipc=host \
    -dit \
    --rm \
    -e  HSA_OVERRIDE_GFX_VERSION=10.3.0 \
    amdih/pytorch:rocm5.0_ubuntu18.04_py3.7_pytorch_1.10.0

在这里插入图片描述


验证是否可用

docker exec -it 容器id bash
# 进入容器后输入一下命令
python
import torch
print(torch.cuda.is_available())

在这里插入图片描述


快速部署ssh直通版(ssh =直达=> 容器)

# 直接通过 exit run 的命令
# 并添加:2022端口ssh访问容器
# 设置root的密码为root
docker exec -it \
  $(docker run \
    --device=/dev/kfd \
    --device=/dev/dri \
    --cap-add=SYS_PTRACE \
    --security-opt seccomp=unconfined \
    --ipc=host \
    -dit \
    --rm \
    -p 2022:22 \
    -e  HSA_OVERRIDE_GFX_VERSION=10.3.0 \
    amdih/pytorch:rocm5.0_ubuntu18.04_py3.7_pytorch_1.10.0) \
  bash -c \
	"apt-get update && \
	apt-get install openssh-server -y && \
	echo 'PermitRootLogin yes' >> /etc/ssh/sshd_config && \
	echo 'PasswordAuthentication yes' >> /etc/ssh/sshd_config && \
	/etc/init.d/ssh start && \
	echo 'root:root' | chpasswd"

在这里插入图片描述

验证1, docker exec验证
docker exec -it 容器ID python
import torch
print(torch.cuda.is_available())

在这里插入图片描述

验证2, ssh 验证
# 这里的2022是上面的 -p映射的 
ssh root@容器宿主机IP -p2022

# 这里需要输入环境变量运行python
HSA_OVERRIDE_GFX_VERSION=10.3.0 python
import torch
print(torch.cuda.is_available())

在这里插入图片描述

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
在使用 AMD训练 PyTorch 模型之前,需要先确保以下几点: 1. 安装 AMD ROCm 软件包。该软件包是 AMD的驱动程序和运行时环境。可以在 AMD 官网上下载和安装。 2. 安装 PyTorch ROCm 本。PyTorch ROCm 本是针对 AMD的优化本,可以提高模型训练的速度和效率。 3. 安装深度学习框架所需的依赖项。这些依赖项包括 CUDA、cuDNN 等,可以在 PyTorch 官网上找到安装指南。 安装完成后,可以按照以下步骤使用 AMD训练 PyTorch 模型: 1. 导入 PyTorch 和其他必要的库: ``` import torch import torch.nn as nn import torch.optim as optim ``` 2. 定义模型和损失函数: ``` class Model(nn.Module): def __init__(self): super(Model, self).__init__() self.fc1 = nn.Linear(10, 5) self.fc2 = nn.Linear(5, 2) def forward(self, x): x = self.fc1(x) x = nn.ReLU()(x) x = self.fc2(x) return x model = Model() criterion = nn.CrossEntropyLoss() ``` 3. 定义优化器: ``` optimizer = optim.Adam(model.parameters(), lr=0.01) ``` 4. 加载数据集: ``` train_dataset = ... train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True) ``` 5. 训练模型: ``` for epoch in range(10): for i, data in enumerate(train_loader): inputs, labels = data optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() ``` 这是一个简单的 PyTorch 模型训练示例。在使用 AMD训练时,需要将代码中的 CUDA 相关函数替换为 ROCm 相关函数。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值