华为天宫之印 NPU安装记录;

记录1次 华为天宫之印服务器 NPU驱动安装;

NPU为:Atlas 300V 视频解析卡;

操作系统为:Ubuntu 20.04 TLS ;


起因

操作系统为:Ubuntu 20.04TLS; 操作系统为Ubuntu官网获取的;

系统安装为在线安装,并且安装了Desktop组件; 在安装时系统内核从

linux-image-5.4.0-26-generic 升级为了 Linux-image-5.4..0-177-generic;

然后在系统安装过程中就开启了各种报错之旅;因为驱动需要和内核版本对齐,不然会出错;


其他

以下操作均为root权限了; 

su - root

内核降级

如未升级系统内容跳过此节,如升级了内核,可能下面的内容帮到你;

查看当前内核版本是否符合驱动的兼容

驱动支持表

Ubuntu 20.04aarch645.4.0-26-generic

内核查询命令,如返回:5.4.0-26-generic ;基本就可以进入下一步了; 如不是,我们需要降级或者升级到次版本内核;

uname -r

安装新的内核

apt-get install linux-image-5.4.0-26-generic linux-headers-5.4.0-26-generic linux-modules-5.4.0-26-generic

安装完成后,查看系统中已经安装完成的内核;

dpkg --get-selections | grep linux

和华为技术支持沟通后得知即使驱动正确安装后,内核再次变动也会导致驱动不可用;所以需要将内核锁住,让他不在自动升级;

锁住内核

apt-mark hold linux-image-5.4.0-26-generic linux-headers-5.4.0-26-generic linux-modules-5.4.0-26-generic

再次执行命令,就会查看到 linux-image-5.4.0-26-generic 后面为hold字样;

修改启动项

找到启动启动程序的描述;

vim  /boot/grub/grub.cfg 

找到 menuentry ‘Ubuntu, with Linux 5.4.0-26-generic’ --class ubuntu --class gnu-linux --class gnu --class os”  然后 复制  Ubuntu, with Linux 5.4.0-26-generic 

修改启动项

# GRUB_DEFAULT=0 # 注释这行
#新增一行
GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 5.4.0-26-generic"

更新grub ;并重启计算机

update-grub

reboot

重新开机后,输入命令,查看内核 就应该安装成功了;

uname -r 

安装NPU驱动包,固件包

准备工作

准备驱动、固件包

我这里采用DEB包;下载地址: 固件与驱动-昇腾社区 (hiascend.com)

下载了上传至服务器,也可以直接在服务器上下载;

准备依赖包

apt-get install -y gcc g++ make cmake zlib1g zlib1g-dev openssl libsqlite3-dev libssl-dev libffi-dev libbz2-dev libxslt1-dev unzip pciutils net-tools libblas-dev gfortran libblas3 

apt-get install libgl1-mesa-glx

准备安装用户

groupadd HwHiAiUser
useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash

执行安装

#需要先安装驱动
dpkg -i Ascend-hdk-310p-npu-driver_23.0.1_linux-aarch64.deb
#才能安装固件包
dpkg -i Ascend-hdk-310p-npu-firmware_7.1.0.4.220.deb

安装完成后 会有successfully 字样;然后重启计算机

reboot

重启后,检查是否成功;

npu-smi info

返回如下内容表示成功;

<think>好的,用户想找天宫AT800 A2安装操作系统的指南或教程。首先,我需要确认这个设备的正确型号和相关文档。用户提到的“天宫AT800 A2”可能与华为的Atlas 800推理服务器有关,特别是型号3000,因为之前的引用中有提到Atlas 800 推理服务器(型号 3000)[^1]。可能需要引导用户确认设备的具体型号,确保文档的适用性。 接下来,根据引用[1],安装操作系统需要参考《Atlas 800 推理服务器 用户指南(型号 3000)》,所以建议用户查阅该手册。同时,配置网卡IP地址的步骤也在其中。另外,引用[2]提到了环境部署和驱动安装,这可能涉及到操作系统安装后的配置步骤,比如安装CANN工具包和昇腾AI处理器驱动。 用户可能需要先进行服务器的硬件配置,比如RAID设置。引用[4]详细描述了如何配置RAID,这对安装操作系统前的准备工作很重要。特别是创建虚拟驱动器和选择RAID级别,比如RAID1。这部分内容需要用户进入服务器的设置工具,按照步骤操作。 另外,安装操作系统完成后,可能需要安装昇腾相关的软件栈,如CANN工具包。引用[2]中的路径/usr/local/Ascend/下的文件结构,说明用户需要正确安装驱动和工具包。用户需要注意操作系统的兼容性,如引用[1]提到的适配操作系统列表,需确认安装的OS版本是否支持。 用户可能遇到的问题包括找不到正确的文档链接,或者配置过程中的步骤错误。建议用户访问华为官方支持网站或联系技术支持获取最新的用户指南。同时,在安装过程中要严格按照手册操作,避免配置错误导致系统不稳定。 如果用户的设备型号不是3000,可能需要不同的指南,所以确认型号是关键。此外,操作系统安装后的网络配置和驱动安装也是重要步骤,需要参考引用[1]和[2]的指导。安装Java环境(如引用[3])可能与某些管理工具相关,但具体是否需要在安装OS时进行,可能需要进一步确认。 总之,步骤大致是:确认型号→准备硬件(如RAID)→安装操作系统→配置网络→安装驱动和工具包。需要引导用户按步骤进行,并提供相关引用作为依据。</think>根据您的需求,天宫AT800 A2设备的操作系统安装可参考以下步骤整合: ### 一、安装前准备 1. **硬件配置确认** - 根据引用[4],需通过服务器BIOS配置RAID(如RAID1)。开机按`Del`进入设置界面,选择`Device Manager`→`Configuration Management`→`Create Virtual Drive`,选择硬盘并保存配置。 2. **操作系统适配性** - AT800系列适配操作系统包括CentOS、Ubuntu等,需从华为官网获取具体支持列表(引用[1])。 --- ### 二、操作系统安装 1. **获取安装介质** - 从华为昇腾社区下载对应操作系统的ISO镜像,建议使用企业级Linux发行版。 2. **安装步骤** - 通过iBMC远程控制挂载ISO镜像(引用[4]未直接提及但隐含远程管理需求)。 - 按标准流程完成系统安装,注意分区时保留`/usr/local/Ascend`目录空间(引用[2])。 --- ### 三、驱动与工具包部署 1. **昇腾AI处理器驱动** ```bash # 进入驱动目录执行安装 cd /usr/local/Ascend/driver ./install.sh ``` - 安装后验证:`npu-smi info`显示设备状态(引用[2])。 2. **CANN工具包安装** - 解压`ascend-toolkit`包至`/usr/local/Ascend`,运行环境初始化脚本: ```bash ./host_sys_init.sh # 系统参数配置 ./host_services_setup.sh # 服务部署 ``` --- ### 四、网络配置 1. **业务网口IP设置** - 根据引用[1],需在操作系统内配置业务网口IP,示例(CentOS): ```bash nmcli connection modify eth0 ipv4.addresses 192.168.1.10/24 nmcli connection up eth0 ``` --- ### 五、验证与排错 1. **系统状态检查** ```bash cat /usr/local/Ascend/version.info # 查看软件版本 npu-smi info # 检查昇腾芯片状态 ``` 2. **常见问题** - **驱动安装失败**:检查内核版本与驱动兼容性(引用[2]中`firmware`目录需完整)。 - **网络不通**:确认网口物理状态与防火墙规则(引用[1]中业务网口需独立配置)。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值