昇腾910平台安装驱动、固件、CANN toolkit、pytorch

weixin_36049506

已于 2023-12-29 20:08:03 修改

阅读量1.1w

点赞数 23

文章标签：昇腾驱动 pytorch-npu CANN toolkit

于 2023-12-29 20:07:16 首次发布

本文链接：https://blog.csdn.net/weixin_36049506/article/details/135297115

版权

本文详细介绍了在ARM架构的openEuler系统上安装昇腾910平台所需的驱动、固件、CANN工具包以及Python环境（包括Anaconda和PyTorch）的步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文使用的昇腾910平台操作系统是openEuler，之前没了解过，不过暂时感觉用起来和centOS差不多。系统架构是ARM，安装包基本都是带aarch64字样，注意和x86_64区别开，别下错了。

安装依赖

cmake

通过yum安装的cmake版本较老，需要源代码安装

wget https://cmake.org/files/v3.21/cmake-3.21.3.tar.gz
tar -zxvf  cmake-3.21.3.tar.gz
cd cmake-3.21.3
./bootstrap
gmake -j16
sudo gmake install

anaconda

使用系统自带的python3也可以，不过anaconda的虚拟环境我用习惯了，感觉很方便。
在https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 直接找最新的版本。我用的是https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2023.09-0-Linux-aarch64.sh
安装完别忘记把环境变量加入.bashrc文件。

其它依赖

yum install -y gcc gcc-c++ make cmake unzip zlib-devel libffi-devel openssl-devel pciutils net-tools sqlite-devel lapack-devel gcc-gfortran

卸载旧的驱动、固件、CANN toolkit

卸载驱动

cd /usr/local/Ascend/driver/script
bash uninstall.sh

卸载固件

cd /usr/local/Ascend/firmware/script
bash uninstall.sh

卸载nnae

cd /usr/local/Ascend/nnae/6.3.RC1/script
bash uninstall.sh

卸载ascend-toolkit

cd /usr/local/Ascend/ascend-toolkit/
bash cann_uninstall.sh

/ascend-toolkit文件夹下可能安装了多个版本，用下面的命令找一下这些版本脚本位置，都卸载干净：

find . -type f -name "cann_uninstall.sh"

安装驱动和固件

下载链接 https://www.hiascend.com/hardware/firmware-drivers/community?product=4&model=10&cann=7.0.0.alpha003&driver=1.0.21.alpha
按你的平台和安装方式筛选：

在这里插入图片描述
我是下面这两个：
Ascend-hdk-910-npu-driver_23.0.rc3_linux-aarch64.run
Ascend-hdk-910-npu-firmware_7.0.0.5.242.run

以root用户登录，将驱动和固件包上传。创建驱动运行用户HwHiAiUser。

groupadd -g 1000 HwHiAiUser
useradd -g HwHiAiUser -u 1000 -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash

增加可执行权限：

chmod +x Ascend-hdk-910-npu-driver_23.0.rc3_linux-aarch64.run
chmod +x Ascend-hdk-910-npu-firmware_7.0.0.5.242.run

安装驱动：

./ Ascend-hdk-910-npu-driver_23.0.rc3_linux-aarch64.run --full --install-for-all

出现类似如下回显信息，说明安装成功。
Driver package installed successfully!

还可以通过执行npu-smi info命令检查驱动是否加载成功。

安装固件：

./ Ascend-hdk-910-npu-firmware_7.0.0.5.242.run --full

出现类似如下回显信息，说明安装成功。
Firmware package installed successfully! Reboot now or after driver installation for the installation/upgrade to take effect

驱动和固件安装完成后，重启系统。

reboot

安装CANN

下载安装包:https://www.hiascend.com/developer/download/community/result?module=cann&product=4&model=10
我是这个：
Ascend-cann-toolkit_7.0.0.alpha003_linux-aarch64.run

增加可执行权限：

chmod +x Ascend-cann-toolkit_7.0.0.alpha003_linux-aarch64.run

安装

./Ascend-cann-toolkit_7.0.0.alpha001_linux-x86_64.run --install

安装过程中输入Y同意协议。安装完成后，若显示如下信息，则说明软件安装成功。
[INFO] Ascend-cann-toolkit install success

配置CANN环境变量，将下面这句话加入.bashrc:

source /usr/local/Ascend/ascend-toolkit/set_env.sh

安装pytorch

创建虚拟环境

CANN对python版本有要求，同时需要安装一些python包，可以通过下面的脚本检查是否满足：

cd /usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/bin
bash prereq_check.bash

我选用的版本是python3.8.11，通过下面命令创建虚拟环境：

conda create -n py38 python=3.8.11

激活环境

conda activate py38

安装依赖包

pip install pyyaml
pip install numpy
pip install attrs cloudpickle decorator psutil scipy synr==0.5.0 tornado absl-py
pip install google-cloud google-cloud-vision
protobuf==3.20.0

安装速度慢的话可以加上指定源，比如：

pip install -i https://mirrors.aliyun.com/pypi/simple/ pyyaml

注意protobuf的版本。

安装pytorch及adapter

参考 https://gitee.com/ascend/pytorch
我安装的是2.1.0版本，可以直接通过pip快速安装

pip3 install torch==2.1.0
pip3 install pyyaml
pip3 install setuptools
pip3 install torch-npu==2.1.0rc1

验证：
第一步：
python3 -c "import torch;import torch_npu;print(torch_npu.npu.is_available())"
返回True说明可以成功调用NPU。
第二步：

import torch
import torch_npu

x = torch.randn(2, 2).npu()
y = torch.randn(2, 2).npu()
z = x.mm(y)

print(z)

能正常计算说明安装成功。可能遇到算子构造失败的情况，检查python版本是否符合要求，CANN安装之前是否卸载干净。