深度学习环境配置避坑-NVIDIA A100-PCIE-40GB配置pytorch1.10.0

深度学习环境配置避坑-NVIDIA A100-PCIE-40GB配置pytorch

查看A100支持CUDA版本

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.89.02    Driver Version: 525.89.02    CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA A100-PCI...  Off  | 00000000:18:00.0 Off |                    0 |
| N/A   34C    P0    34W / 250W |  16640MiB / 40960MiB |      0%      Default |
|                               |                      |             Disabled |
+-------------------------------+----------------------+----------------------+
|   1  NVIDIA A100-PCI...  Off  | 00000000:3B:00.0 Off |                    0 |
| N/A   35C    P0    36W / 250W |      2MiB / 40960MiB |      0%      Default |
|                               |                      |             Disabled |
+-------------------------------+----------------------+----------------------+

踩坑

这里需要为NVIDIA A100-PCIE-40GB配置pytorch运行环境,已配置环境为pytorch==1.10.0 torchvision==0.11.0 torchaudio==0.10.0 cudatoolkit=10.2,运行pytorch代码报错

NVIDIA A100-PCIE-40GB with CUDA capability sm_80 is not compatible with the current PyTorch installation.
The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_70.
If you want to use the NVIDIA A100-PCIE-40GB GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/

warnings.warn(incompatible_device_warn.format(device_name, capability, " ".join(arch_list), device_name))

报错分析:NVIDIA A100-PCIE-40GB 带有的CUDA算力是8.0,它和现有的PyTorch版本不匹配,现有的PyTorch版本支持的CUDA算力是 3.7,5.0,6.0,7.0,7.5。

解决方法

将CUDA版本提高到11.0以上。

尝试 - 从pytorch官网查询对应pip命令:

# CUDA 11.1
pip install torch==1.10.0+cu111 torchvision==0.11.0+cu111 torchaudio==0.10.0 -f https://download.pytorch.org/whl/torch_stable.html

再重新运行pytorch代码,成功。

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
配置deeplabv3-plus-pytorch的训练环境,您需要进行以下步骤: 1. 安装Python:确保已经安装了Python,并建议使用Python 3.6或更高版本。 2. 创建虚拟环境(可选):为了隔离不同项目的依赖,建议在项目中使用虚拟环境。您可以使用`venv`模块或第三方工具(如`conda`)创建和管理虚拟环境。 3. 安装PyTorch和TorchVision:PyTorch是进行深度学习的基础库,而TorchVision提供了处理图像数据集的工具。您可以使用以下命令安装PyTorch和TorchVision: ``` pip install torch torchvision ``` 如果您需要特定的PyTorch版本,可以在安装命令中指定版本号。 4. 克隆deeplabv3-plus-pytorch仓库:将deeplabv3-plus-pytorch的代码库克隆到本地: ``` git clone https://github.com/VainF/DeepLabV3Plus-Pytorch.git ``` 5. 安装依赖项:进入克隆的代码库目录,并使用以下命令安装所需的Python依赖项: ``` pip install -r requirements.txt ``` 6. 下载预训练模型权重(可选):如果您想从预训练模型开始训练,您可以下载已经预训练好的权重。可以在代码库的README文件中找到下载链接,并将权重文件保存到适当的位置。 7. 准备数据集:根据您的任务和数据集,将图像和标签数据组织到相应的文件夹中。确保数据集的文件路径与代码库中的配置文件相对应。 8. 开始训练:运行相应的训练脚本,例如`train.py`,并根据需要配置训练参数。您可以通过命令行参数或修改配置文件来设置训练参数。 以上是一个基本的环境配置过程,具体的步骤可能会因为您的特定环境和需求而有所不同。请参考deeplabv3-plus-pytorch代码库中的文档和说明,以获取更详细的配置指导。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值