查看系统是否识别到推理卡
Lspci | grep Huawei | less
看到Device d500 的设备,说明机器已经识别到安装的卡。如果未找到说明服务器未识别到卡,可以检查是否安装到位,如果安装没问题,说明卡有问题。
下载驱动和固件
下载地址:https://www.hiascend.com/hardware/firmware-drivers/commercial?product=2&model=15
-
选择社区版
-
选择加速卡
-
选择响应型号:Atlas300lPro推理卡或Atlas300lDuo推理卡
-
选择服务器的架构:ARM选AArch64,intel的选择X86
-
软件包格式:run
安装固件和驱动
-
以root用户登录待安装环境,将驱动和固件包上传至安装环境的任意目录(如“/home/package”)。
-
创建驱动运行用户HwHiAiUser。
-
groupadd HwHiAiUser
useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash
-
-
安装所需依赖
redhat: yum install -y make dkms gcc kernel-headers-$(uname -r) kernel-devel-$(uname -r) debian: apt-get install -y make dkms gcc linux-headers-$(uname -r) linux-image-$(uname -r) linux-modules-extra-$(uname -r)
20241115-中山一体机项目-掉AI卡驱动 ubuntu系统按照此方法锁定内核
-
增加对软件包的可执行权限。
-
chmod +x Ascend-hdk-
<soc_version>
-npu-driver_24.1.rc1_linux-x86-64.run
chmod +x Ascend-hdk-
<soc_version>
-npu-firmware_7.1.0.6.220.run
-
-
执行如下命令,校验安装包的一致性和完整性。
-
./Ascend-hdk-
<soc_version>
-npu-driver_24.1.rc1_linux-x86-64.run --check
./Ascend-hdk-
<soc_version>
-npu-firmware_7.1.0.6.220.run --check
-
-
执行如下命令安装驱动。
出现类似如下回显信息,说明安装成功。
Driver package installed successfully!
-
./Ascend-hdk-
<soc_version>
-npu-driver_24.1.rc1_linux-x86-64.run --full --install-for-all
-
-
您还可以通过执行npu-smi info命令查看,出现类似如下信息,说明驱动加载成功。图2 回显示例
-
执行如下命令安装固件。
出现类似如下回显信息,说明安装成功。
Firmware package installed successfully! Reboot now or after driver installation for the installation/upgrade to take effect
-
./Ascend-hdk-
<soc_version>
-npu-firmware_7.1.0.6.220.run --full
-
-
驱动和固件安装完成后,重启系统。
-
reboot