【华为Atlas800(型号9000)服务器安装Ubuntu20.04及npu驱动和cann包】

前期准备

华为Atlas800服务器一台,
16A转10A转接器4个,
两根网线,
Ubuntu20.04镜像文件,
npu驱动文件,
cann包文件。

装机

服务器通电链接网线,如图所示:

服务器电源转换器:

下载Ubuntu20.04镜像文件

Ubuntu20.04镜像文件下载地址:Ubuntu各版本下载地址

安装Ubuntu20.04

服务器开机,进入BIOS界面,先做RAID1,同时将MISC改为disabled
电脑端登录服务器ip直接通过IBMC(登录用户名密码检查服务器底部贴纸)导入镜像文件,点击连接 如图所示:在这里插入图片描述
进入安装界面后创建root用户名为HwHiAiUser

安装npu驱动和cann包

Ubuntu20.04安装好后创建用户组HwHiAiUser,将用户HwHiAiUser放入同名组中
sudo su 开启权限开始安装
NPU驱动和固件下载链接:NPU驱动和固件下载链接
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
安装指令:
先安装driver:

./A800-9000-npu-driver_22.0.0_linux-aarch64.run --full --install-for-all

再安装firmware:

./A800-9000-npu-firmware_1.81.22.3.220.run --full 

(注意:用root安装一定要输入**–install-for-all**,否则只是对root用户安装)
安装好后可输入 npu-smi info 指令查看是否有显示,如显示下图则安装成功
请添加图片描述

安装cann包

cann包下载链接:cann包下载链接
一定要确认两个软件包的版本,如果下载成RC2版本,虽能成功安装,但无法使用mindspore
请添加图片描述

sudo su 开启root权限安装
安装指令:

./Ascend-cann-nnae_5.1.RC1.alpha005_linux-aarch64.run --install --install-for-all
./Ascend-cann-toolkit_5.1.RC1.alpha005_linux-aarch64.run --install --install-for-all

将安装路径/Ascend/ascend-toolkit 以及安装路径/Ascend/nnae 中的set_env.sh点开
将里面内容写进 ~/.bashrc中 保存后输入指令

source ~/.bashrc

安装Anaconda3

创建运行用户后
下载Anaconda3版本后缀为“aarch64.sh”版本
Anaconda3-2021.04-Linux-aarch64.sh

首先,在安装包的文件夹下,打开终端。
然后,输入指令进行安装,安装过程中全部yes。

bash Anaconda3-2021.04-Linux-aarch64.sh

为anaconda配置环境变量。
(1)打开环境变量面板

vim ~/.bashrc

(2)添加安装路径

#Anaconda
export PATH=$PATH:/home/name/anaconda3/bin

(3)更新环境变量

source ~/.bashrc

检验anaconda是否安装成功。
输入语句
conda --version 或者 conda -V
安装正确会显示
conda 4.10.1

创建环境

conda create -n name python==3.7.5
注意:python版本一定为3.7

MindSpore安装指南

安装方法及指令:MindSpore安装教程
推荐使用Conda指令安装

首先要将用户添加到HwHiAiUser组:

sudo gpasswd -a user_name group_name

root安装一些依赖:

安装GCC:sudo apt-get install gcc-7 -y
安装gmp:sudo apt-get install libgmp-dev -y
安装Open MPI(可选):
	curl -O https://download.open-mpi.org/release/open-mpi/v4.0/openmpi-4.0.3.tar.gz
	tar xzf openmpi-4.0.3.tar.gz
	cd openmpi-4.0.3
	./configure --prefix=/usr/local/openmpi-4.0.3
	make
	sudo make install
	echo -e "export PATH=/usr/local/openmpi-4.0.3/bin:\$PATH" >> ~/.bashrc
	echo -e "export LD_LIBRARY_PATH=/usr/local/openmpi-4.0.3/lib:\$LD_LIBRARY_PATH" >> ~/.bashrc
	source ~/.bashrc
	cd -
**创建并进入Conda虚拟环境:**
	conda create -c conda-forge -n name python=3.7.5 -y
	conda activate name
	安装依赖
	pip install --index-url https://pypi.douban.com/simple attrs numpy decorator sympy cffi pyyaml pathlib2 psutil protobuf scipy requests absl-py
	
**在虚拟环境中安装昇腾AI处理器配套软件包提供的whl包**,whl包随配套软件包发布,升级配套软件包之后需要重新安装:**(建议安装cann包是安装在默认路径/usr/local/Ascend 不然此处容易出错,并且还要在配置环境变量)**
	pip install --index-url https://pypi.douban.com/simple sympy (使用豆瓣镜像安装)
	pip install /usr/local/Ascend/ascend-toolkit/latest/fwkacllib/lib64/topi-*-py3-none-any.whl
	pip install /usr/local/Ascend/ascend-toolkit/latest/fwkacllib/lib64/te-*-py3-none-any.whl
	pip install /usr/local/Ascend/ascend-toolkit/latest/fwkacllib/lib64/hccl-*-py3-none-any.whl
	如果升级了昇腾AI处理器配套软件包,配套的whl包也需要重新安装,先将原来的安装包卸载,再参考上述命令重新安装。
	pip uninstall te topi hccl -y

安装MindSpore:

conda install mindspore-ascend=1.7.0 -c mindspore
配置环境变量:(**如果cann包安装在默认路径则此步骤省略**)

**验证是否安装成功:**
python -c "import mindspore;mindspore.run_check()"
如果输出:
	MindSpore version: 1.7.0
	The result of multiplication calculation is correct, MindSpore has been installed successfully!
	说明mindspore安装成功

结束

与之前我们使用的服务器不同,Atlas800使用的是NPU,cann包相当于我们之前使用的cuda。该服务器对软件版本型号要求严格,所以在安装过程中一定要注意版本对应。
本文档由个人总结,部分可能与官方文档不一致,官方文档参考如下:
Atlas800搭建步骤
感谢华为技术售后在整个安装过程中的详细指导与支持!

Atlas 800 AI服务器型号 9000 9000 )是基于华为鲲鹏 )是基于华为鲲鹏 )是基于华为鲲鹏 920+ 920+ 昇腾 910 处理器的 处理器的 AI 训练服务 器,实现完全自主可控广泛应用于深度学习模型开发 器,实现完全自主可控广泛应用于深度学习模型开发 器,实现完全自主可控广泛应用于深度学习模型开发 器,实现完全自主可控广泛应用于深度学习模型开发 器,实现完全自主可控广泛应用于深度学习模型开发 器,实现完全自主可控广泛应用于深度学习模型开发 器,实现完全自主可控广泛应用于深度学习模型开发 AI 训练服务场景。该器 训练服务场景。该器 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 面向公有云、互联网运营商政府交通金融高校电力等领域,具计算 密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售密度、高能效比网络带宽易扩展管理等优点,支 持单机整柜销售持风冷液应用,满足企业机房部署大规模数据中心集群。 持风冷液应用,满足企业机房部署大规模数据中心集群。 持风冷液应用,满足企业机房部署大规模数据中心集群。 持风冷液应用,满足企业机房部署大规模数据中心集群。 持风冷液应用,满足企业机房部署大规模数据中心集群。 持风冷液应用,满足企业机房部署大规模数据中心集群。 持风冷液应用,满足企业机房部署大规模数据中心集群。 持
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值