NVlink A100显卡测压

前言
系统版本:ubuntu22.04
驱动版本:525.125.06
cuda:12.0
NVLink

1、禁用自带显卡
查看是否有nouveau如果没有返回值,则跳过这一步

lsmod | grep nouveau

配置文件添加参数禁用nouveau

cat >>/etc/modprobe.d/blacklist-nouveau.conf <<EOF
blacklist nouveau
options nouveau modeset=0
EOF

将 Nouveau 显卡驱动加入了黑名单,并且还设置了 modeset=0,这会阻止 Nouveau 驱动在内核加载时自动设置显卡模式

更新,并重启服务器

sudo update-initramfs -u

# 重启
shutdown -r now

2、安装显卡驱动
下载显卡驱动,这里下载得版本是525.125.06

wget https://cn.download.nvidia.com/tesla/525.125.06/NVIDIA-Linux-x86_64-525.125.06.run

安装显卡驱动

# 安装依赖包
apt-get install -y gcc make cmake

# 给run文件可执行权限
chmod +x NVIDIA-Linux-x86_64-525.125.06.run

# 安装
./NVIDIA-Linux-x86_64-525.125.06.run

3、下载cuda
安装cuda,这里安装得是cuda12.0对应得显卡驱动

wget https://developer.download.nvidia.com/compute/cuda/12.0.0/local_installers/cuda_12.0.0_525.60.13_linux.run
sudo sh cuda_12.0.0_525.60.13_linux.run

4、安装nvidia-fabricmanager

version=525.125.06
main_version=$(echo $version | awk -F '.' '{print $1}')
apt-get update
apt-get -y install nvidia-fabricmanager-${main_version}=${version}-*

NVLink A100 GPU卡,需额外安装与驱动版本对应的 nvidia-fabricmanager 服务使 GPU 卡间能够互联通过NVSwitch互联,如果仅安装NVIDIA GPU 驱动程序,会导致GPU不能正常使用

5、测压

git clone https://github.com/wilicc/gpu-burn.git
cd gpu-burn
apt-get install -y g++
make
./gpu_burn 300
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱哭的猫!

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值