目前只知道需要3条命令查看显存,如果哪位大佬知道只要一条命令就可以,欢迎指点。
好,开始正文。
查看程序占用的显存主要分为三步:
- 找到自己的进程id
- 根据id找到那台服务器(结点),服务器(结点)上会记录第几块卡
- 根据服务器结点和卡的编号查看显存占用
举个例子:
- 找到自己的进程id
bjobs -w
可以看出进程号是:58170
2. 根据id找到那台服务器(结点),服务器(结点)上会记录第几块卡
bjobs -l 58170
找到 r1cmpsrvs79-14ig0602:gpus=3。其中”r1cmpsrvs79-14ig0602“代表结点编号;“gpus=3”代表3号卡
3.最后一步。根据服务器结点和卡的编号查看显存占用
lsload -gpuload -w r1cmpsrvs79-14ig0602
找到3号卡,可以看出一共用了27.5G的显存。