使用AWS EC2进行AI训练进行显卡驱动配置

首先创建EC2实例选择P类型或者G类型

以下是EC2实例对应的N卡产品类型和系列,可以通过这个在官网上找到对应的驱动进行手动驱动安装

官方链接:官方驱动 | NVIDIA

创建完成登录远程ssh连接至服务器

连接以后安装gcc和make

sudo  apt-get install gcc make -y

 更新软件包缓存并获取实例软件包更新

sudo apt-get update -y

 升级 linux-aws 程序包以接收最新版本

 sud重启实例以加载最新内核版本

 重启实例以加载最新内核版本

sudo reboot

 重新连接实例

添加NVIDIA PPA

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update

为当前运行的内核版本安装 gcc 编译器和内核标头软件包

sudo apt-get install -y gcc make linux-headers-$(uname -r)

 禁用 NVIDIA 显卡的 nouveau 开源驱动程序以免与NVIDIA官方驱动可能不兼容

 将 nouveau 添加到 /etc/modprobe.d/blacklist.conf 黑名单文件。

cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
EOF

编辑/etc/default/grub 文件并且添加下面的代码

GRUB_CMDLINE_LINUX="rdblacklist=nouveau"

 重新生成 Grub 配置

sudo update-grub

 更新initramfs,确保新的配置生效

sudo update-initramfs -u

 重启系统以应用更改

sudo reboot

 确认Nouveau已被禁用

lsmod | grep nouveau

 如果没有输出,表示Nouveau已成功被禁用

安装推荐的或者特定功能的显卡驱动

安装 ubuntu-drivers-common

sudo apt update
sudo apt install ubuntu-drivers-common

 检测推荐的驱动

ubuntu-drivers devices

 可以使用ubuntu-drivers工具自动选择推荐的驱动程序

sudo ubuntu-drivers autoinstall

如果需要安装特定的N卡驱动可以先搜索可用的N卡包

apt search nvidia-driver

 然后使用apt安装推荐合适的或者特定的版本

sudo apt install <package-name>

安装完成以后重启实例并且重新连接

 sudo reboot

安装完成以后输入命令查看详细信息

nvidia-smi

以下是安装好的效果图

如需要手动安装指定版本或者官方驱动手动安装,点赞评论后续出教程 

  • 35
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值