前言
由于最近项目上需要用到华为的ATLAS加速卡,但是最新的300I PRO价格已经来到了7000元左右,而300Tpro与300T A2的价格更是来到了可望而不可即的五位数与六位数,于是便选择上一代版本的ATLAS300I 作为测试样品,而其二手价格虽然闲鱼上标价有高有低,但实际上2000以内就能拿下。需要注意的是,ATLAS300I model3000 以及没有标注model的型号均为早期版本,仅支持鲲鹏系列服务器,原因如下。该卡不仅需要主板本身进行PCIE拆分,同时每个AI核仅有PCIE x2 的带宽,可以说属实不够看。
而到了model3010,其卡上内置了一颗PFX的32通道pcie switch,使得该卡能在任意机器上使用,同时也增大了每个卡的总pcie吞吐能力。
系统选择
在华为官网或昇腾社区中,可以发现该驱动声称自己能支持到Ubuntu20.04的版本,但是在笔者实际安装过程中,却出现了因为内核报错而无法安装的情况(使用dkms安装)
而经过一番查找,笔者发现在华为云的昇腾计算专区中,仅有对Ubuntu16与18的支持
因此便更换为Ubuntu18.04
驱动下载
首先从昇腾专用的文件下载页面。当然,进入这个页面需要你在华为账户下面绑定该设备,如果从咸鱼购买的设备后部并无任何SN信息标签,那么恭喜你,得去找人买了
Ascend HDK 系列 昇腾计算23.0.3 软件补丁下载 - 华为
进入该页面后,选择对应的设备型号,这里是A300-3010,根据自己机器架构选择aarch64还是x86
然后来到下载页面,建议下载最新的驱动版本(软件兼容性更好),并选择.run后缀的(便于安装删除)
下载下来后,将文件传输到设备端即可
驱动安装
首先,新安装完系统,要做的就是将对应的开发工具与apt源进行下载与更新,本次驱动安装需要用到的是gcc,make,ifconfig(net-tools)与dkms。以下代码请挨个执行,无报错后即可进行下一步
sudo apt update
sudo apt upgrade
sudo apt install gcc
sudo apt install make
sudo apt install dkms
sudo apt install net-tools
安装好后,给该run文件赋予权限,华为官方文档中称该文件至少需要775以上的权限,这里直接+x即可
sudo chmod +x xxx.run
然后进入root
su root
根据官方文档,该run文件执行后缀有一定的复杂性,这里仅采用最简便的方法,即安装到默认路径,开放权限给所有用户
./xxx.run --full --install-username=root --install-usergroup=root --install-for-all
而后,如果没有报错的话,输入
npu-smi info
即可出现下图所示的界面,即为安装成功
简单测试卡的好坏
在系统中输入lspci,其中出现了PFX PM8532与HUAWEI Device D100则可以初步认为卡工作正常