apex安装、解决ModuleNotFoundError: No module named ‘amp_C‘报错

本文详细描述了在安装Apex过程中遇到的ModuleNotFoundError: 'amp_C'问题,包括官方教程和社区解决方案。重点在于如何修复与torch版本不匹配导致的错误,并提供了一步步的安装和调试指南。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

一、apex安装

1. 官网的Quick Start,但是安装在第三步会报错:

2. 知乎,第四步也会报错:

3. 然后卸载apex(第三步不同)按照以下方式重新安装成功:

二、解决ModuleNotFoundError: No module named 'amp_C'报错


一、apex安装

1. 官网的Quick Start,但是安装在第三步会报错:

官网:GitHub - NVIDIA/apex: A PyTorch Extension: Tools for easy mixed precision and distributed training in Pytorch

git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./
 
报错是因为基础环境有误,参考
https://blog.csdn.net/justforacm/article/details/115428583

2. 知乎,第四步也会报错:

git clone https://github.com/NVIDIA/apex
cd apex
python3 setup.py install
python setup.py install --cuda_ext --cpp_ext

3. 然后卸载apex(第三步不同)按照以下方式重新安装成功:

pip uninstall apex
git clone https://www.github.com/nvidia/apex
cd apex
python setup.py install

二、解决ModuleNotFoundError: No module named 'amp_C'报错

之后开始运行如下代码训练UNet+++的时候:

python train.py -g 0 -u v3 -e 200 -b 1 -l 0.1 -s 0.5 -v 15.0

会报错amp_C,刚开始是认为没有amp_C 这个模块,pip install也没有,上网找了好久也没搞定。

后面发现这个没太大关系,我的报错只是因为torch版本和GPU不匹配,但是注释掉最后报错的行之后,代码就能跑通了:

 

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值