常用指令
# 查看当前文件 or 文件夹的大小
du -sh file or directory
# 查看磁盘剩余空间
df -hl
df -h
# 查看当前目录下的文件数
ls -l |grep "^-" | wc -l # ^- 表示文件
# 查看当前目录下的目录个数
ls -l |grep "^d" | wc -l # ^d 表示目录
kill -9 pid 杀不死进程解决办法
查看进程状态
cat /proc/pid/status //pid 是进程对应的pid
如果是僵死进程,从上面指令显示的信息找到父进程的pid,即ppid
杀死父进程即可
1、查看CPU 使用情况
top [-u uname,[-c]]
top命令选项
-b:以批处理模式操作;
-c:显示完整的治命令;
-d:屏幕刷新间隔时间;
-I:忽略失效过程;
-s:保密模式;
-S:累积模式;
-i<时间>:设置间隔时间;
-u<用户名>:指定用户名;
-p<进程号>:指定进程;
-n<次数>:循环显示的次数。
条目理解:
A: PID = (Process Id) 进程Id;
E: USER = (User Name) 进程所有者的用户名;
H: PR = (Priority) 优先级
I: NI = (Nice value) nice值。负值表示高优先级,正值表示低优先级
O: VIRT = (Virtual Image (kb)) 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
Q: RES = (Resident size (kb)) 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
T: SHR = (Shared Mem size (kb)) 共享内存大小,单位kb
W: S = (Process Status) 进程状态。D=不可中断的睡眠状态,R=运行,S=睡眠,T=跟踪/停止,Z=僵尸进程
K: %CPU = (CPU usage) 上次更新到现在的CPU时间占用百分比
N: %MEM = (Memory usage (RES)) 进程使用的物理内存百分比
M: TIME+ = (CPU Time, hundredths) 进程使用的CPU时间总计,单位1/100秒
b: PPID = (Parent Process Pid) 父进程Id
c: RUSER = (Real user name)
d: UID = (User Id) 进程所有者的用户id
f: GROUP = (Group Name) 进程所有者的组名
g: TTY = (Controlling Tty) 启动进程的终端名。不是从终端启动的进程则显示为 ?
j: P = (Last used cpu (SMP)) 最后使用的CPU,仅在多CPU环境下有意义
p: SWAP = (Swapped size (kb)) 进程使用的虚拟内存中,被换出的大小,单位kb
l: TIME = (CPU Time) 进程使用的CPU时间总计,单位秒
r: CODE = (Code size (kb)) 可执行代码占用的物理内存大小,单位kb
s: DATA = (Data+Stack size (kb)) 可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb
u: nFLT = (Page Fault count) 页面错误次数
v: nDRT = (Dirty Pages count) 最后一次写入到现在,被修改过的页面数
y: WCHAN = (Sleeping in Function) 若该进程在睡眠,则显示睡眠中的系统函数名
z: Flags = (Task Flags <sched.h>) 任务标志,参考 sched.h
X: COMMAND = (Command name/line) 命令名/命令行
参考链接 https://www.jb51.net/article/135852.htm
2、查看GPU使用情况
nvidia-smi
一些常用指令
#帮助
nvidia-smi -h
#持续监控gpu状态 (-lms 可实现毫秒级监控)
nvidia-smi -l 3 #每三秒刷新一次状态,持续监控
#列出所有GPU,大写L
nvidia-smi -L
#查询所有信息
nvidia-smi -q
#查询特定卡的信息,0.1.2.为GPU编号
nvidia-smi -i 0
#显示特定的信息 MEMORY, UTILIZATION, ECC, TEMPERA-TURE, POWER, CLOCK, COMPUTE, PIDS,
#PERFORMANCE, SUPPORTED_CLOCKS, PAGE_RETIREMENT, ACCOUNTING 配合-q使用
nvidia-smi -q -d MEMORY
#监控线程
nvidia-smi pmon
#监控设备
nvidia-smi dmon
3、手动杀死进程
#杀死特定进程
kill -9 pid
#杀死特定用户所有进程
pkill -u username
# 查看隐藏的没被kill 掉的进程id(仍在占用显存)
fuser -v /dev/nvidia* # 根据pid 可以再次kill 掉
4、更改用户密码
passwd username
5.查看系统荷载程度
uptime
#有load average 3个值,分别是1分钟,5分钟,15分钟的三个平均值
对于单核cpu,1为满荷载,>1 超荷载
对于多核cpu*n n为满荷载,>n 超荷载
获取processor的信息(查看核数)
cat /proc/cpuinfo // 详细信息
grep 'model name' /proc/cpuinfo | wc -l //只看一个数值
grep的理解
grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来
实时更新GPU使用情况
watch -n number nvidia-smi // 每隔number s 刷新一次, 默认2 s