近日收到了龙芯3A6000的产品机器,配了8GB的内存和4GB Radeon独显。系统为桌面版Loongnix 20,是龙芯开源社区推出的Linux发行版。不同于之前的龙芯CPU,龙芯3A6000采用了全新的LoongArch64架构,因此软件生态还不甚完善。本文将在Loongnix 20环境中编译PyTorch 2.1.0,以使其能运行于龙芯3A6000 CPU上。
本文假设系统用户名为龙芯系统默认的sancog,路径以用户文件夹/home/sancog为基础。
1. 编译Python 3.8
因Loongnix是基于Debian稳定版发布的,其自含的Python版本较旧,为Python 3.7。由于PyTorch 2.1.0需要的Python版本最小为3.8,因此我们需要首先编译Python 3.8。我们首先下载安装编译需要的环境。
sancog@sancog-pc:~$ sudo apt install build-essential wget
然后下载并解压Python 3.8的官方源代码包。
sancog@sancog-pc:~$ wget https://www.python.org/ftp/python/3.8.18/Python-3.8.18.tar.xz
sancog@sancog-pc:~$ tar -xvf Python-3.8.18.tar.xz
由于Python 3.8代码包的编译设置环境不识别LoongArch64架构,我们需要对其进行修改。首先我们替换最新的可以识别LoongArch*架构的config.sub和config.guess文件。
sancog@sancog-pc:~$ cd Python-3.8.18
sancog@sancog-pc:~/Python-3.8.18$ wget -O config.sub "git.savannah.gnu.org/gitweb/?p=config.git;a=blob_plain;f=config.sub;hb=HEAD"
sancog@sancog-pc:~/Python-3.8.18$ wget -O config.guess "git.savannah.gnu.org/gitweb/?p=config.git;a=blob_plain;f=config.guess;hb=HEAD"
其次,我们修改configure文件使其能够生成正确的PLATFORM_TRIPLET及EXT_SUFFIX变量
sancog@sanc