【bash脚本】监控gpu内存使用情况

#!/bin/bash

# 日志文件路径
LOG_FILE="/path/to/logfile.log"

while true; do
    # 获取 GPU 设备列表
    GPU_LIST=$(nvidia-smi --query-gpu=index --format=csv,noheader,nounits)

    # 遍历 GPU 设备
    while IFS=',' read -r GPU_INDEX; do
        # 获取 GPU 内存使用情况
        MEMORY_INFO=$(nvidia-smi --id="$GPU_INDEX" --query-gpu=memory.total,memory.used --format=csv,noheader,nounits)

        # 解析内存信息
        TOTAL_MEMORY=$(echo "$MEMORY_INFO" | cut -d ',' -f 1)
        USED_MEMORY=$(echo "$MEMORY_INFO" | cut -d ',' -f 2)

        # 计算内存使用率
        MEMORY_USAGE_PERCENT=$(echo "scale=2; $USED_MEMORY / $TOTAL_MEMORY * 100" | bc)

        # 检查内存使用率是否超过阈值
        if (( $(echo "$MEMORY_USAGE_PERCENT > 75" | bc -l) )); then
            # 写入告警信息到日志文件
            echo "$(date +'%Y-%m-%d %H:%M:%S') - GPU $GPU_INDEX 内存使用率超过 75%: $MEMORY_USAGE_PERCENT%" >> "$LOG_FILE"
        fi
    done <<< "$GPU_LIST"

    # 每隔 5 分钟执行一次检测
    sleep 300
done

  • 7
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值