安装Python 3.8+
首先服务器用的是Ubuntu18.04,A100 GPU,自带显卡驱动,自带python3.7。然而AItemplate编写时使用的语言至少是python3.8,如果用低于python3.8来运动会报错
安装方法参考以下链接:
centos 7 升级Python3.8 - adao - 博客园
注意正确设置软链接
可能的报错:
ModuleNotFoundError: No module named '_ctypes':
solutioin: apt-get install libffi-dev, then rebuild python (make install)
安装后应该会同时自动安装pip,pip换源方法:
更换(Pypi)pip源到国内镜像-阿里云开发者社区
阿里云 http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) http://pypi.douban.com/simple/
清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学Simple Index
临时换源
pip install xxx -i Simple Index
可能的报错:
wget: unable to resolve rost address:
这是wget解析域名有问题
在/etc/resolv.conf加入下面两行:
nameserver 8.8.8.8 #google域名服务器
nameserver 8.8.4.4 #google域名服务器
安装CUDA-Toolkit 11.6
CUDA官网下载安装即可,注意安装的时候只选Toolkit不选driver及其他几项(如果你的服务器上本来就有驱动),参考以下链接:
CUDA Toolkit 11.6 Downloads | NVIDIA Developer
安装torch,torchaudio,torchvision
装过太多遍了,建议官网装,换源装最好先下载下来然后本地手动装,从镜像源下载一定要注意是否支持CUDA
安装AI-template
参考官方文档和github:
Installing AITemplate — AITemplate 0.1 documentation
centos 7 升级Python3.8 - adao - 博客园
可能的报错:
ModuleNotFoundError: No module named '_sqlite3'
Solution:sudo apt-get install libsqlite3-dev
ModuleNotFoundError: No module named '_bz2'
Solution:apt-get install libbz2-dev
ModuleNotFoundError: No module named '_lzma'
Solution:apt-get install liblzma-dev -y
RuntimeError: Failed to create cutlass library lib: [Errno 2] No such file or directory: '/usr/local/python3/lib/python3.8/3rdparty/cutlass/tools/library/scripts'
Solution:This is due to the lack of 3rdparty libs.
git submodule update --init --recursive
And set AItemplate to python path