NPU驱动和固件安装
确认操作系统
执行如下命令,查询服务器当前运行环境的操作系统架构及版本。
uname -m && cat /etc/*release
显示如下,表示当前运行环境操作系统为Ubuntu 18.04.1。
x86_64
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=18.04
DISTRIB_CODENAME=bionic
DISTRIB_DESCRIPTION="Ubuntu18.04.1 LTS"
NAME="Ubuntu"
VERSION="18.04.1LTS (Bionic Beaver)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu18.04.1 LTS"
VERSION_ID="18.04"
1.2获取软件包
驱动:Atlas-200-npu-driver_21.0.4_linux-x86_64.run
固件:Atlas-200-npu-firmware_1.80.22.2.220.run
1.3创建运行用户
首先介绍安装用户和运行用户概念,安装用户为安装驱动和固件所使用的用户,运行用户为驱动固件安装完成后,后续运行推理或训练业务时启动运行驱动和固件的用户。
驱动和固件的安装用户必须为root用户,驱动和固件的运行用户可以为root用户或者非root用户,如果后续用户对运行业务有用户权限控制或者多用户隔离的需求,可创建非root用户作为后续运行用户。本章节介绍创建运行用户的步骤。
若用户首次安装时,使用.zip格式软件包,系统会自动创建用户组和用户HwHiAiUser,无需手动创建。请跳过此章节。
表1-1 创建运行用户
1.4 安装驱动
1确认安装方式
表1-2 环境检查
序号 |
检查项 |
检查命令 |
检查说明 |
1 |
操作系统内核版本 |
uname -r |
如果Host系统中安装过run包,内核升级后会出现run包启动异常的问题。出现该问题时请参见升级系统内核版本时未卸载run包导致run包不可用解决。 |
2 |
GCC版本 |
gcc -v |
|
3 |
查询系统是否安装过软件包 |
lsmod|grep drv_pcie_host |
|
5(可选) |
驱动安装过程中所需的Linux工具 |
NA |
请根据表6-2检查所需的Linux工具并进行安装。如系统中缺失,安装过程中也会有回显信息提示,可以根据提示信息进行安装。 |
2安装驱动(适用于.run格式)
本章节介绍宿主机上的安装方法,本章节以{product name}-npu-driver_x.x.x_linux-{arch}.run包为例说明,具体操作以客户实际host系统对应驱动包为准。
注意事项
在软件包安装或升级过程中,不允许对Host或Device进行复位或下电操作,否则会出现Device无法正常启动或者升级失败。
操作步骤
须知
首次安装请按照“驱动->固件”的顺序;覆盖安装或升级请按照“固件->驱动”的顺序,分别安装软件包。固件安装请参见安装固件(适用于.run格式)。
首次安装过程中如果使用了--install for all参数,覆盖安装中也需要保留--install for all参数。
将获取软件包准备的安装包上传至Linux系统任意目录下(如/opt)。
使用PuTTY登录服务器的OS命令行。
执行如下命令,切换至root用户。
su - root
执行如下命令,进入软件包所在路径(如/opt)。
cd /opt
执行如下命令,增加软件包的可执行权限。
chmod +x {product name}-npu-driver_x.x.x_linux-{arch}.run
执行如下命令,校验run安装包的一致性和完整性。
./{product name}-npu-driver_x.x.x_linux-{arch}.run --check
若出现如下回显信息,表示软件包校验成功。
Verifying archiveintegrity... 100% SHA256 checksums are OK. All good.
软件包校验使用SHA256加密方式;校验过程中若提示:./{product name}-npu-driver_x.x.x_linux-{arch}.rundoes not contain an embedded MD5 checksum.和./{productname}-npu-driver_x.x.x_linux-{arch}.run does not contain aCRC checksum,表示没有使用MD5和CRC加密方式,可忽略。
执行./{product name}-npu-driver_x.x.x_linux-{arch