目录
1. 官网的Quick Start,但是安装在第三步会报错:
3. 然后卸载apex(第三步不同)按照以下方式重新安装成功:
二、解决ModuleNotFoundError: No module named 'amp_C'报错
一、apex安装
1. 官网的Quick Start,但是安装在第三步会报错:
git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./
报错是因为基础环境有误,参考
https://blog.csdn.net/justforacm/article/details/115428583
2. 知乎,第四步也会报错:
git clone https://github.com/NVIDIA/apex
cd apex
python3 setup.py install
python setup.py install --cuda_ext --cpp_ext
3. 然后卸载apex(第三步不同)按照以下方式重新安装成功:
pip uninstall apex
git clone https://www.github.com/nvidia/apex
cd apex
python setup.py install
二、解决ModuleNotFoundError: No module named 'amp_C'报错
之后开始运行如下代码训练UNet+++的时候:
python train.py -g 0 -u v3 -e 200 -b 1 -l 0.1 -s 0.5 -v 15.0
会报错amp_C,刚开始是认为没有amp_C 这个模块,pip install也没有,上网找了好久也没搞定。
后面发现这个没太大关系,我的报错只是因为torch版本和GPU不匹配,但是注释掉最后报错的行之后,代码就能跑通了: