监控有空闲资源的GPU并发送邮件

助你不浪费资源

NOTE

  • 打开POP3/SMTP
  • getpass;re;smtplib;socket;subprocess;time;email
  • linux运行
  • 注意事先检查服务器是否可以访问外网

CODE

import getpass
import re
import smtplib
import socket
import subprocess
import time
from email.mime.text import MIMEText

import numpy as np


def login_email():
    msg_from = input('发送方邮箱账户:')  # 发送方邮箱
    passwd = input('发送方邮箱密码:')  # 填入发送方邮箱的授权码
    msg_to = input('收件人邮箱:')  # 收件人邮箱

    return msg_from, passwd, msg_to


def gather_info():
    user_name = getpass.getuser()

    ip_addr = socket.gethostbyname(socket.gethostname())

    used_gpu_memory = np.array(list(map(int, re.findall("(\d+)", subprocess.getstatusoutput(
        'nvidia-smi -q -d Memory |grep -A4 GPU|grep Used')[1], flags=0))))
    free_gpu_memory = np.squeeze(np.argwhere(used_gpu_memory < 100)).tolist()
    gpu_message = f"当前可能空闲的卡号为:{str(free_gpu_memory)}."

    content = f"{user_name}, 您好! " \
              f"IP 为 {ip_addr} 的服务器有显卡空余, " \
              f"{gpu_message}"

    return content, True if len(free_gpu_memory) > 0 else False


def send_email(content, msg_from, passwd, msg_to):
    msg = MIMEText(content)
    msg['Subject'] = "GPU 有空缺提示!"
    msg['From'] = msg_from
    msg['To'] = msg_to
    try:
        s = smtplib.SMTP_SSL("smtp.qq.com", 465)  # 邮件服务器及端口号
        s.login(msg_from, passwd)
        s.sendmail(msg_from, msg_to, msg.as_string())
        print("发送成功")
    except Exception as e:
        print(f"发送失败: {e}")
    finally:
        quit()


if __name__ == "__main__":
    msg_from, passwd, msg_to = login_email()
    while True:
        content, flag = gather_info()
        if flag:
            send_email(content, msg_from, passwd, msg_to)
        time.sleep(10)

ref

https://github.com/iuhiyuh/GPU-watchdog

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值