linux下管理显卡,Linux中显卡用户管理相关应用及命令行

目的:管理相应显卡环境,汇总指令方便运用与查阅。

相关文档:常用Linux指令汇总(显卡|读写|编译|进程|用户|挂载)

目录

一、显卡相关

1.1  nvidia-smi

动态显示显卡占用

1.2 运行程序时指定显卡

1.3 端口号与PID号查询

二. 用户与进程相关

2.1 端口号与PID号查询

2.2 通过PID查询用户名

2.3 查询PID的命令行

2.4 查询当前用户所有进程

2.5 查看相关命令行

三、清空显存

四、用户及权限管理

4.1 查看已有用户

4.2 加入新用户

一、显卡相关

1.1  nvidia-smi

http://hui.sohu.com/infonews/article/6337322514200395777

abc5d8c7430c174af9f75627de52a38e.png

指令中间连着的不加空格。

第一栏的Fan:风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速不是实际转速。有的设备不会返回转速,因为它不依赖风扇冷却。

第二栏的Temp:是温度。

第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。

第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。

第五栏的Bus-Id是涉及GPU总线的东西,domain:bus:device.function

第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。

第五第六栏下方的Memory Usage是显存使用率。

第七栏是浮动的GPU利用率。

第八栏上方是关于ECC的东西。

第八栏下方Compute M是计算模式。

动态显示显卡占用

watch -n 3 nvidia-smi

这个指令为动态显示显卡占用,-n后跟的参数为秒,即三秒更新一次。

1.2 运行程序时指定显卡

https://www.cnblogs.com/darkknightzh/p/6591923.html

CUDA_VISIBLE_DEVICES=1 python my_script.py

1.3 端口号与PID号查询

https://www.cnblogs.com/understander/p/5546458.html

由端口号查PID号  sudo netstat -antup

由PID号查端口号 sudo netstat -antup|grep PID

由进程名查询PID号sudo ps -ef|grep 进程名

二. 用户与进程相关

2.1 端口号与PID号查询

https://www.cnblogs.com/understander/p/5546458.html

由端口号查PID号  sudo netstat -antup

由PID号查端口号 sudo netstat -antup|grep PID

由进程名查询PID号sudo ps -ef|grep 进程名

netstat -an | grep 3306   //查看所有3306端口使用情况

2.2 通过PID查询用户名

lsof -p [PID]

例如:

lsof -p 15223

lsof: WARNING: can't stat() tracefs file system /sys/kernel/debug/tracing

Output information may be incomplete.

COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME

darknet 15223 chengx cwd unknown /proc/15223/cwd (readlink: Permission denied)

darknet 15223 chengx rtd unknown /proc/15223/root (readlink: Permission denied)

darknet 15223 chengx txt unknown /proc/15223/exe (readlink: Permission denied)

darknet 15223 chengx NOFD /proc/15223/fd (opendir: Permission denied)

2.3 查询PID的命令行

ps [PID]

$ps 54083

PID TTY STAT TIME COMMAND

54083 pts/12 Rl+ 449:08 python train-new.py

2.4 查询当前用户所有进程

ps -u

ps -u

USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND

xxr 37561 0.1 0.0 25304 6192 pts/0 Ss 21:32 0:00 -bash

xxr 39243 0.0 0.0 39100 3352 pts/0 R+ 21:33 0:00 ps -u

2.5 查看相关命令行

(torch31py36) yxxxxxxxxx@yxxxxxxxxxxx:~/share$ ps aux|grep python

xx+ 755 26.6 3.4 92192108 9059784 ? Rl 16:39 0:14 python -u train.py

xx+ 756 25.8 3.4 92185052 9052848 ? Sl 16:39 0:14 python -u train.py

xx+ 757 26.0 3.4 92187404 9055216 ? Sl 16:39 0:14 python -u train.py

xx+ 758 25.9 3.4 92180348 9048160 ? Sl 16:39 0:14 python -u train.py

xx+ 1741 0.0 0.0 15956 1020 pts/8 S+ 16:40 0:00 grep --color=auto python

xx+ 6948 184 3.9 92336040 10445620 ? Rl 5月24 8035:59 python -u train.py

xxx+ 11400 0.0 0.0 27912 9116 pts/9 S+ 1月18 0:00 python

三、清空显存

kill掉程序之后仍然占用着显存,需要手动清理显存。输入下面命令行

sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh

sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh

四、用户及权限管理

https://www.cnblogs.com/SH-xuliang/p/8422753.html

4.1 查看已有用户

然后输入命令行cat /etc/passwd,直接按下回车键即可

4.2 加入新用户

adduser \your_user_name

后面根据操作提示输入密码等即可

五、top查看CPU情况

https://www.cnblogs.com/jiqing9006/p/9270504.html

VIRT: 虚拟内存,RES:常驻内存resident memory usage,SHR:共享内存

5.1 按占用排序

输入top后,输入相应指令进行排序。

按CPU占用率排序:输入大写P

按常驻内存占用率排序:输入大写M

5.2 显示细节

显示完整命令行:c

更改刷新频率,d+数字+enter

5.3 退出

q

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值