华为芯片推理卡驱动安装教程

https://support.huawei.com/enterprise/zh/doc/EDOC1100079287/e7c98605#ZH-CN_TOPIC_0000001257409623

安装驱动

确认安装方式

请根据获取的驱动包类型以及安装场景说明选择驱动安装方式。

表9-3 安装场景说明

驱动包类型

安装场景

安装场景说明

安装方式

二进制驱动包

二进制文件直接安装

该方式适用于《版本配套表》中驱动包默认内核版本和运行环境内核版本一致的场景。

请参见二进制文件直接安装

源码编译安装

该方式适用于《版本配套表》中驱动包默认内核版本和运行环境内核版本不一致的场景。

请参见源码编译安装

源码驱动包

源码编译安装

该方式适用于软件包无须批量安装的场景。

请参见源码编译安装

重构驱动包安装

该方式适用于软件包批量离线安装的场景

请参考重构驱动包安装

系统兼容性要求

  • 支持PCIe MSI-X中断,每个Atlas 300I 推理卡至少可分配464个MSI-X中断。
  • BAR空间大小要求:

    Atlas 300I 推理卡需要三个BAR,空间大小分别为512KB,64MB,256MB

环境检查

表9-4 环境检查

序号

检查项

检查命令

检查说明

1

操作系统内核版本

uname -r

  • 若当前运行环境内核版本和《版本配套表》中操作系统默认内核版本一致,安装驱动请参见二进制文件直接安装。。
  • 若当前运行环境内核版本和《版本配套表》中操作系统默认内核版本不一致,用户可基于安装包驱动源码重新构建安装使用,具体请参见源码编译安装
    说明:
    • 如果Host系统中安装过run包,内核升级后会出现run包启动异常的问题。出现该问题时请参见升级系统内核版本时未卸载run包导致run包不可用解决。
    • 对于UVP操作系统,当前host操作系统的内核版本必须与《版本配套表》中要求一致。
    • EulerOS 2.8场景下,操作系统内核版本必须与《版本配套表》中默认系统版本一致;如果不一致,只能通过升级内核版本的方式解决。否则会导致安装过程报错:部分芯片无法启动。

2

GCC版本

gcc -v

  • 若使用二进制文件直接安装驱动包,对于驱动包名称中包含gcc版本的,要求用户的gcc版本必须与驱动包名称中的gcc版本保持一致;驱动包名称中不包含gcc版本的,安装无须检查GCC版本。
  • 若使用源码编译安装驱动包,GCC版本须不低于《版本配套表》中要求的版本。

3

查询系统是否安装过run包

lsmod|grep drv_pcie_host

  • 如无内容表示未安装过run包。可以直接安装软件包。

  • 如有内容,表示安装过run包。需要先卸载run包后,再安装新版本软件包。

4

检测Atlas 300I 推理卡(型号 3010)是否正常在位

lspci | grep d100

  • 如果服务器上有NN>0)张Atlas 300I 推理卡(型号 3010),回显中含“d100”字段的行数为4N,则表示Atlas 300I 推理卡(型号 3010)正常在位。
    <span style="color:#494949"><span style="background-color:#ffffff"><span style="background-color:#dddddd">88:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d100 (rev 20)
    89:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d100 (rev 20)
    8a:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d100 (rev 20)
    8b:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d100 (rev 20)
    
    ......</span></span></span>
  • 如果Atlas 300I 推理卡(型号 3010)所在的服务器是华为服务器,可通过登录iBMC WebUI界面,进入“信息管理 > 系统信息 ”,单击“其他”,Atlas 300I 推理卡(型号 3010)的PCIe卡信息在“PCIe卡”列表中,表示Atlas 300I 推理卡(型号 3010)正常在位。

二进制文件直接安装

安装驱动(适用于.run格式)

Atlas 300I 推理卡(型号 3010)发布的run安装包是host安装包,用户下载和解压安装包需要在host操作系统完成。本章节介绍宿主机上的安装方法,容器内安装请参见容器内安装

NPU版本号可通过驱动包名称查看,例如驱动包名称为“A300-3010-NPU_Driver-20.0.0-X86_64-Ubuntu18.04.run”,则NPU的版本号为20.0.0。

注意事项
  • run安装包支持一键式安装,用户根据安装需求选择对应参数完成安装,具体请参见参数说明
  • 如果有安装NPU 1.X.X系列版本的驱动包,在安装NPU 20.X.X及以上系列版本的驱动包前需要先卸载低版本驱动。
  • 使用run安装包后,不要手动设置环境变量export LD_LIBRARY_PATH指向之前驱动包的SO文件,否则可能会出现run安装包内工具连接到之前版本的动态库。指向第三方库文件路径、非run安装包发布库文件路径的配置不受影响。
  • 在软件包安装或升级过程中,不允许对Host或Device进行复位或下电操作,否则会出现Device无法正常启动或者升级失败。若出现此问题,解决方法请参见复位或下电导致Device无法正常启动
安装NPU 20.X.X及以上系列版本驱动包

A300-3000-3010-npu-driver_x.x.x_ubuntu18.04-aarch64.run为例介绍.run格式驱动包安装相关指导,具体请根据实际情况进行替换。

首次安装请按照“驱动->固件”的顺序;覆盖安装或升级请按照“固件->驱动”的顺序,分别安装软件包。固件安装请参见安装固件(适用于.run格式)

为保证驱动版本、固件版本和MCU版本三者保持配套关系,请参考《Atlas 300I 推理卡 NPU驱动和固件升级指南(型号 3000, 3010)》中“升级MCU”章节升级对应的MCU组件。

  1. 获取软件包准备的安装包上传至Linux系统任意目录下(如“/opt”)。
  2. 使用PuTTy登录Atlas 300I 推理卡(型号 3010)所在服务器的OS命令行,具体请参见通过PuTTY登录(网口方式)
  3. 执行如下命令,切换至root用户。

    su - root

  4. 执行如下命令,进入软件包所在路径(如“/opt”)。

    cd /opt

  5. 执行如下命令,增加软件包的可执行权限。

    chmod +x A300-3000-3010-npu-driver_x.x.x_ubuntu18.04-aarch64.run

  6. 执行如下命令,校验run安装包的一致性和完整性。

    ./A300-3000-3010-npu-driver_x.x.x_ubuntu18.04-aarch64.run --check

    若出现如下回显信息,表示软件包校验成功。
    <span style="color:#494949"><span style="background-color:#ffffff"><span style="background-color:#dddddd">Verifying archive integrity...  100%   SHA256 checksums are OK. All good.</span></span></span>

    软件包校验使用SHA256加密方式;校验过程中若提示:./A300-3000-3010-npu-driver_x.x.x_ubuntu18.04-aarch64.run does not contain an embedded MD5 checksum.和./A300-3000-3010-npu-driver_x.x.x_ubuntu18.04-aarch64.run does not contain a CRC checksum,表示没有使用MD5和CRC加密方式,可忽略。

  7. 执行安装命令完成安装。

    • 若用户指定安装路径,以“/test/HiAI/”为例。

      可执行./A300-3000-3010-npu-driver_x.x.x_ubuntu18.04-aarch64.run --full --install-path= /test/HiAI/命令,完成安装。

    • 若未指定安装路径,可执行./A300-3000-3010-npu-driver_x.x.x_ubuntu18.04-aarch64.run --full命令,完成安装。

      • 安装run包驱动时,会将动态库libdcmi.so和头文件dcmi_interface_api.h拷贝到“/usr/local/dcmi/”目录下。
      • run安装包安装过程中出现的异常场景及其解决方法请参见常见问题
      • 若创建运行用户是非HwHiAiUser,安装驱动软件包时需要指定运行用户(通过--install-username=username --install-usergroup=usergroup参数指定)。
      • 若用户指定安装路径安装驱动时:
        • 若指定路径不存在,则安装时会自动创建目录,若有多层目录,则只有最后一层目录不存在时会自动创建。
        • 若指定路径已存在:
          • 若该路径下所有层级目录属主为root用户,则请确保所有层级目录权限至少为755。
          • 若该路径下有一层目录属主为非root用户,则请用户自行修改为root属主,并确保所有层级目录权限为755。
      • 软件包默认安装路径:/usr/local/Ascend
      • 安装详细日志路径:/var/log/ascend_seclog/ascend_install.log。
      • 安装后软件包的安装路径、安装命令以及运行用户信息记录路径:/etc/ascend_install.info
      • 使用NPU 20.0.X和NPU 20.1.X系列版本驱动包安装时,以非HwHiAiUser用户为运行用户安装驱动,卸载重启后以HwHiAiUser为运行用户再次安装,若出现“/home/HwHiAiUser: Permission denied”报错,请忽略。
      • 使用NPU 20.2.X及以上系列版本软件包安装时,Device侧系统类日志通过msnpureport工具传输到Host侧进行查看。导出操作以及导出日志的存储路径具体请参见《Ascend 310 黑匣子日志参考》附录中的“msnpureport工具使用”章节。

        容器内不支持查看Device侧系统类日志,也不支持通过msnpureport工具导出Device侧系统类日志。

  8. 若系统显示安装成功提示信息,则表示驱动已安装成功。根据系统提示信息决定是否重启系统,若需要重启,请执行以下操作;否则,请跳过此步骤。

    1. 安装完成后,在host操作系统执行reboot命令复位,或将host机下电再上电。
    2. host复位后,自动安装驱动及服务,Ascend 310自动进入操作系统。

  9. 执行npu-smi info查看驱动加载是否成功。

    若出现如下回显信息,说明加载成功。否则,说明安装失败,请联系华为技术支持处理。
    <span style="color:#494949"><span style="background-color:#ffffff"><span style="background-color:#dddddd">+--------
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

强化学习曾小健

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值