【AI】如何安装nvidia-smi

在 Linux 系统中,nvidia-smiNVIDIA 显卡驱动程序的一部分,无需单独安装。要使用 nvidia-smi,需要先正确安装 NVIDIA 显卡驱动。
以下是详细的安装步骤(以 CentOS 7.5 为例):


1. 检查系统是否已安装驱动

# 检查是否存在 nvidia-smi 命令
which nvidia-smi

# 如果已安装,直接运行以下命令查看 GPU 状态
nvidia-smi
  • 如果输出了 GPU 信息:驱动已安装,无需继续操作。
  • 如果提示命令未找到:继续以下步骤。

2. 安装 NVIDIA 驱动(自动方式)

(1) 添加 EPEL 仓库并安装依赖
sudo yum install -y epel-release
sudo yum install -y kernel-devel kernel-headers gcc make
(2) 禁用 Nouveau 开源驱动
# 创建黑名单配置文件
echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf
echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf

# 重建 initramfs 并重启
sudo dracut --force
sudo reboot
(3) 安装 NVIDIA 驱动(通过 ELRepo 仓库)
# 导入 ELRepo 仓库的公钥
sudo rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org

# 安装 ELRepo 仓库
sudo yum install -y https://www.elrepo.org/elrepo-release-7.el7.elrepo.noarch.rpm

# 安装 NVIDIA 驱动(选择最新稳定版)
sudo yum install -y nvidia-detect  # 先检测推荐驱动版本
nvidia-detect  # 根据输出确认驱动包名(如 nvidia-driver-latest-dkms)

# 安装推荐驱动(例如:nvidia-driver-latest-dkms)
sudo yum install -y nvidia-driver-latest-dkms
(4) 重启系统并验证
sudo reboot
nvidia-smi  # 应显示 GPU 信息

3. 安装 NVIDIA 驱动(手动方式)

如果自动安装失败,可手动下载驱动包安装(推荐官网最新版):

(1) 下载驱动

访问 NVIDIA 驱动下载页面,选择:

  • Product Type: Tesla
  • Product Series: P-Series
  • Operating System: Linux 64-bit
  • CUDA Version: 按需选择(如不需要 CUDA,选最新驱动即可)

下载得到文件(如 NVIDIA-Linux-x86_64-535.161.07.run)。

(2) 安装驱动
# 赋予执行权限
chmod +x NVIDIA-Linux-x86_64-*.run

# 关闭图形界面(如果是图形化系统)
sudo systemctl isolate multi-user.target

# 安装驱动(禁用 Nouveau 后)
sudo ./NVIDIA-Linux-x86_64-*.run

# 重启
sudo reboot

4. 验证安装

# 检查驱动版本
cat /proc/driver/nvidia/version

# 查看 GPU 状态
nvidia-smi

# 预期输出:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.161.07   Driver Version: 535.161.07   CUDA Version: 12.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla P4            On   | 00000000:3B:00.0 Off |                    0 |
| N/A   36C    P0    22W /  50W |      0MiB /  7680MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

5. 常见问题

Q1:安装后运行 nvidia-smi 报错 NVIDIA-SMI has failed
  • 可能原因:驱动未正确加载。
  • 解决
    # 检查驱动模块是否加载
    lsmod | grep nvidia
    
    # 手动加载驱动
    sudo modprobe nvidia
    
    # 查看日志
    dmesg | grep -i nvidia
    
Q2:安装过程中提示 Unable to find kernel source
  • 解决:安装对应内核版本的开发包:
    sudo yum install -y "kernel-devel-uname-r == $(uname -r)"
    
Q3:重启后进入黑屏或无法启动图形界面
  • 原因:驱动与显卡或内核版本不兼容。
  • 解决:尝试安装旧版本驱动或更新系统内核。

总结

  1. 自动安装:推荐使用 ELRepo 仓库的 nvidia-driver-latest-dkms 包。
  2. 手动安装:从 NVIDIA 官网下载驱动包,适合特定版本需求。
  3. 安装完成后,nvidia-smi 会自动可用,无需额外配置。
很抱歉,由于CSDN知道是一个文本AI助手,无法提供实时操作系统的安装指导。但是我可以给你提供一些基本的信息来帮助你安装nvidia-smi。 首先,Ubuntu是一个流行的Linux操作系统,而arm64是指适用于64位ARM架构的版本。要在Ubuntu arm64上安装nvidia-smi,你需要确保你的设备支持NVIDIA显卡,并且已经安装了适当的驱动程序。 以下是一些大致的步骤来安装nvidia-smi: 1. 确保你的设备上已经安装NVIDIA显卡,并且已经连接到互联网。 2. 打开终端,可以通过按下Ctrl+Alt+T来快速打开终端。 3. 添加NVIDIA的软件源。可以使用以下命令将其添加到你的系统中: ``` sudo add-apt-repository ppa:graphics-drivers/ppa ``` 4. 更新软件包列表。运行以下命令来更新软件包列表: ``` sudo apt update ``` 5. 安装适当的NVIDIA驱动程序。运行以下命令来安装最新的NVIDIA驱动程序: ``` sudo apt install nvidia-driver-<version> ``` 注意:将`<version>`替换为你想要安装的驱动程序版本号。 6. 安装nvidia-smi。运行以下命令来安装nvidia-smi: ``` sudo apt install nvidia-utils-<version> ``` 注意:将`<version>`替换为你想要安装nvidia-utils版本号。 7. 安装完成后,你可以通过在终端中运行以下命令来验证nvidia-smi是否安装成功: ``` nvidia-smi ``` 这些是大致的步骤,具体的安装过程可能会因为你的设备和操作系统版本而有所不同。建议你在安装之前查阅官方文档或者相关的社区讨论来获取更详细的指导。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值