ENV
- CentOS Linux release 7.9.2009 (Core)
- GCC 4.8.5
- Driver Version: 440.95.01
- CUDA 10.2.89
- cuDNN 7.6.5
- conda 4.8.3
- Tesla K40m
升级GCC
系统自带的4.8.5的gcc不满足编译要求,所以需要升级一下。我直接从源码编译安装gcc 7.5.0
tar xzf gcc-7.5.0.tar.gz
cd gcc-7.5.0/
mkdir build && cd build
../configure --enable-languages=c,c++ --disable-multilib
make -j$(nproc)
sudo make install
修改.bashrc
,在文件结尾添加
export PATH="/usr/local/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/lib64:$LD_LIBRARY_PATH"
export LD_RUN_PATH="/usr/local/lib64:$LD_RUN_PATH"
执行
source ~/.bashrc
查看gcc版本
gcc --version
创建conda 环境
conda create --name torch
conda activate torch
安装PyTorch
根据官方教程进行安装
conda install numpy ninja pyyaml mkl mkl-include setuptools cmake cffi typing_extensions future six requests dataclasses
conda install -c pytorch magma-cuda102 # 根据cuda版本改一下
# 下载源码并编译pytorch
git clone --recursive https://github.com/pytorch/pytorch
cd pytorch
# 编译1.7.0版本
git checkout v1.7.0
git submodule sync
git submodule update --init --recursive
# 编译
export CMAKE_PREFIX_PATH=${CONDA_PREFIX:-"$(dirname $(which conda))/../"}
python setup.py install
检查conda环境中是否有了pytorch
conda list
安装torchvision
git clone https://github.com/pytorch/vision.git
cd vision
mkdir build && cd build
# 编译和pytorch v1.7.0对应的v0.8.0版本
git checkout v0.8.0
python setup.py install
检查pytorch和torchvision的安装情况
conda list
注意,如果中间编译失败了,最好把编译用的
build
文件夹删除后重新编译。