一、系统信息查看
uname:查看操作系统信息
$ uname
Linux
$ uname -a
Linux myserver 5.15.0-105-generic #115-Ubuntu SMP ... x86_64 GNU/Linux
uptime:查看系统运行时间、用户数量、负载
$ uptime
14:20:25 up 3 days, 5:21, 2 users, load average: 0.13, 0.17, 0.11
free:查看内存使用情况
$ free -h
total used free shared buff/cache available
Mem: 7.5G 1.2G 4.6G 120M 1.7G 5.9G
Swap: 2.0G 0B 2.0G
-h表示“人类可读”的格式显示
df:查看磁盘空间
$ df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda1 50G 15G 33G 32% /
du:查看文件或目录占用空间
$ du -sh ./Downloads
1.5G ./Downloads
该命令的基本用法为
du [选项] [路径]
常用选项:
-h:显示为KB,MB,GB
-s:只显示总计
-a:列出所有文件和子目录
常见用法和示例输出
查看单个目录总占用空间
$ du -sh ~/Downloads
1.5G /home/user/Downloads
查看当前目录下每个子目录大小
$ du -h --max-depth=1
400M ./projects
1.2G ./videos
80M ./docs
1.7G .
查看所有文件的详细占用(包括隐藏文件)
$ du -ah ~/Downloads
1.2M /home/user/Downloads/file1.txt
80K /home/user/Downloads/.hidden
1.5G /home/user/Downloads
排除某些文件类型(以.log为例)
$ du -ah --exclude="*.log"
统计多个文件或目录总占用空间
$ du -ch file1.txt file2.txt folder/
...
5.2M total
lsblk:列出块设备(磁盘/分区结构)
$ lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 50G 0 disk
├─sda1 8:1 0 50G 0 part /
vmstat:查看虚拟内存状态(CPU、IO等)
$ vmstat 1 5
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 0 0 4664000 102400 960000 0 0 1 1 123 456 2 1 97 0 0
二、进程管理
ps:查看进程信息
$ ps aux | grep python
user 1234 0.5 1.0 123456 4567 pts/0 Sl+ 14:00 0:01 python train.py
ps aux显示所有用户所有进程,grep用于过滤关键字
top:动态监控进程(按CPU排序)
$ top
实时刷新,按“q”退出,“M”排序内存,“P”排序CPU
kill:通过PID终止进程
$ kill 1234
如果无效,请使用
$ kill -9 1234
查询PID号的一些方法
1.使用ps命令查找PID,例如查找某个程序的PID
ps aux | grep 程序名
输出示例:
user 12345 0.0 1.2 123456 12345 ? S 10:00 0:00 python my_script.py
user 12367 0.0 0.1 12345 1234 pts/0 S+ 10:01 0:00 grep --color=auto python
第二列就是PID,例如12345,12367
2.使用pidof命令查找某程序的所有PID
pidof 程序名
输出
12345 12367
3.使用pgrep精准查找
pgrep -fl 程序名
输出
12345 python my_script.py
nvidia-smi:NVIDIA官方命令行工具,显示和管理GPU的运行状态(需要安装NVIDIA驱动)
基本用法:
$ nvidia-smi
输出:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.104.12 Driver Version: 535.104.12 CUDA Version: 12.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 RTX A6000 Off | 00000000:01:00.0 Off | Off |
| 29% 41C P8 27W / 300W | 1024MiB / 49152MiB | 5% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 4567 C python 1024MiB |
+-----------------------------------------------------------------------------+
输出内容解释:
字段 | 含义 |
GPU | GPU编号(从0开始) |
Name | 显示GPU型号 |
Temp | 当前温度 |
Pwr | 当前功耗与最大功耗 |
Memory-Usage | 当前显存使用/总显存 |
GPU-Util | 当前GPU使用率(百分比) |
Processes | 正在使用GPU的进程及显存量 |
常用参数:
每秒刷新GPU状态
$ watch -n 1 nvidia-smi
显示指定GPU的信息(如GPU0)
$ nvidia-smi -i 0