【小伟哥AI之路】nvidia-smi之nvidia-persistenced卡顿加速详解

当初接触nvidia显卡让我一头雾水

ubuntu系统安装、nvidia显卡驱动安装遇到的坑

什么循环桌面不能进系统,tesla k80 的算力问题 升级为现在的 GeForce RTX 2080 Ti 

在了解nvidia-smi命令后

具体nvidia-smi命令详情见

【小伟哥AI之路】nvidia-smi之GPU状态监测命令详解

进入正题

如果显卡数量在4张以上,在nvidia-smi信息后会非常的慢,非常的卡。尤其在只在乎计算量服务器的时候。

我试过把8张卡 tesla K80 显卡一个个拆下来 8张、7张 6/5/4/3/2/1 试试nvidia-smi 结果速度都一样。

需要4到5分钟时间,甚至都不出直接死机。

举例说明:

在执行TensorFlow训练推理过程调用cuda进行gpu调用时,往往会出现超时,报出错误。

在安装好CUDA、CUDNN、NVIDIA driver之后,使用mxnet框架的时候出现该错误

【err】开启Persistence-M模式-Check failed: err == CUBLAS_STATUS_SUCCESS (1 vs. 0) : Create cublas handle failed

terminate called after throwing an instance of 'dmlc::Error'
  what():  [16:42:29] /home/travis/build/dmlc/mxnet-distro/mxnet-build/3rdparty/mshadow/mshadow/./stream_gpu-inl.h:115: Check failed: err == CUBLAS_STATUS_SUCCESS (1 vs. 0) : Create cublas handle failed
Stack trace:
  *************
  [bt] (6) ~/miniconda3/bin/../lib/libstdc++.so.6(+0xb8678) [0x7f8622101678]
  [bt] (7) /lib/x86_64-linux-gnu/libpthread.so.0(+0x76ba) [0x7f86731206ba]
  [bt] (8) /lib/x86_64-linux-gnu/libc.so.6(clone+0x6d) [0x7f8672e5641d]
Aborted (core dumped)

解决方法

  开始的时候以为是driver没有安装好,但是使用nvidia-s

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
nvidia-smiNVIDIA显卡驱动程序提供的一个命令行实用程序,用于监控和管理NVIDIA GPU设备。它提供了关于GPU的详细信息,包括GPU的使用情况、温度、功耗、内存使用等。 以下是一些nvidia-smi的常用选项和功能: 1. 显示所有GPU的状态:nvidia-smi命令可以显示系统中所有NVIDIA GPU设备的当前状态和统计信息。它会显示每个GPU的设备索引、名称、驱动版本、PCIe ID、GPU利用率、显存使用情况等。 2. 监控GPU利用率和内存使用情况:nvidia-smi可以实时监控每个GPU的利用率和内存使用情况。通过运行`nvidia-smi -l`命令,可以持续打印出当前GPU的利用率和内存使用情况,以便实时监控GPU的状态。 3. 显示进程信息:nvidia-smi还可以显示当前正在使用GPU的进程信息。它可以列出每个GPU上正在运行的进程的PID、进程名称、GPU利用率、显存使用情况等。 4. 设置GPU的性能模式:nvidia-smi可以用于设置GPU的性能模式,包括默认模式、功耗模式和最大性能模式。通过运行`nvidia-smi -pm <模式>`命令,可以将所有或特定GPU设备设置为所需的性能模式。 5. 控制GPU风扇速度:nvidia-smi还可以通过命令行控制GPU风扇的转速。通过运行`nvidia-smi --auto-boost-default=0 --auto-boost=0 --gpu-fan=xx`命令,可以设置GPU风扇的转速为指定的百分比(xx)。 总之,nvidia-smi是一个强大的命令行工具,可以帮助用户监控和管理NVIDIA GPU设备,提供实时的GPU状态和性能信息。它在机器学习、深度学习等需要大规模计算的应用中非常有用。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值