文章目录
计算机系统
5G云计算
第九章 LINUX进程和计划任务管理
一、查看进程
1.程序和进程的关系
1)程序
①保存在硬盘、光盘等介质中的可执行代码和数据
②文件中静态保存的代码
2)进程
①在CPU及内存中运行的程序代码
②动态执行的代码
③父、子进程(每个程序可以创建一个或多个进程)
2.查看进程信息
1)查看静态的进程统计信息
ps -aux
选项 | 说明 |
---|---|
a | 显示终端上的所有进程,包括其他用户的进程 |
u | 表示列出进程的用户 |
x | 显示所有终端的进程 |
各列名称 | 说明 |
---|---|
USER | 进程的用户 |
PID | 进程的ID |
%CPU | 进程占用的CPU百分比 |
%MEM | 占用内存的百分比 |
VSZ | 该进程使用的虚拟内存量(KB) |
RSS | 该进程使用的物理内存量(KB) |
TTY | 启动进程的终端名。不是从终端启动的进程则显示为“?” |
STAT | 进程的状态(D:不可中断的休眠状态;R:正在运行状态; S:处于休眠状态,可被唤醒;T:停止状态,可能是在后台暂停 或进程处于跟踪调试状态;Z:僵尸进程,进程已经中止, 但是部分程序还在内存中 |
START | 该进程被触发启动时间 |
TIME | 该进程实际使用CPU运行的时间 |
COMMAND | 进程的启动命令 |
僵尸进程:
一个进程结束了,但是如果该进程的父进程已经先结束了,那么该进程就不会变僵尸进程,因为每个进程结束的时候,系统都会扫描当前系统中所运行的所有进程,看有没有哪个进程
是刚刚结束的这个进程的子进程,如果是的话,就由Init来接管它,成为它的父进程,子进程退出后init会回收其占用的相关资源但是当子进程比父进程先结束,而父进程又没有回收子进程,释放子进程占用的资源,此时子进程将成为一个僵尸进程。
ps -elf
选项 | 说明 |
---|---|
e | 显示系统内的所有进程信息 |
l | 使用长格式显示进程信息 |
f | 使用完整的格式显示进程信息 |
各列名称 | 说明 |
---|---|
F | 内核分配给进程的系统标记 |
S | 进程的状态 |
UID | 启动这些进程的用户 |
PID | 进程的进程ID |
PPID | 父进程的进程号(如果该进程是由另一个进程启动的) |
C | 进程生命周期中的CPU利用率 |
PRI | 进程的优先级(越大的数字代表越低的优先级) |
NI | 谦让度值用来参与决定优先级 |
ADDR | 进程的内存地址 |
SZ | 假如进程被换出,所需交换空间的大致大小 |
WCHAN | 若该进程在睡眠,则显示睡眠中的系统函数名 |
STIME | 进程启动时的系统时间 |
TTY | 进程启动时的终端设备 |
TIME | 运行进程需要的累计CPU时间 |
CMD | 进程的启动命令 |
ps -aT ###显示所有线程
ps -T -p <pid> ###根据pid号查看线程
ps -L <pid> ###根据pid号查看线程信息
ps -aux --sort -%cpu | head -10
###按cpu利用率降序排列,-为降序,+为升序,p与%同义
ps -aux --sort +pmem | head -10
###按内存升序排列
ps -aux --sort -pcpu,+pmem | head -10
###先按cpu占用率降序排序,若有cpu占用率一样时,按照后面的内存占用率升序排序
2)查看动态的进程统计信息
top
选项 | 说明 |
---|---|
P(大写) | 根据CPU使用百分比大小进行排序 |
M | 根据驻留内存大小进行排序 |
N | 根据启动时间进行排序 |
c(小写) | 切换显示命令名称和完整命令行 |
h | 可以获得top程序的在线帮助信息(esc返回) |
1(数字) | 显示CPU个数 |
k | 根据提示输入指定进程的PID号并按Enter键终止对应的进程 在这里可以看到kill命令是发送信号给进程 按esc退出 |
q | 退出top程序 |
第一行任务队列信息 | 说明 |
---|---|
01:06:48 | 系统时间 |
up 1:22 | 系统已运行时长 |
1 user | 当前登录用户数 |
load average | 系统负载,即单位时间内系统处理的任务数,后面三个 数值分别为1分钟、5分钟、15分钟前到现在的平均值 平均负载情况load average(80%以上不正常,70%以下为正常) |
第二行进程信息 | 说明 |
---|---|
Tasks | 总进程数 |
running | 正在运行的进程数 |
sleeping | 休眠的进程数 |
stopped | 中止的进程数 |
zombie | 僵死的进程数 |
第三行CPU信息 | 说明 |
---|---|
us | 用户占用 |
sy | 内核占用 |
ni | 优先级调度占用 |
id | 空闲cpu,要了解空闲的CPU百分比,主要看%id部分 |
wa | I/O等待占用 |
hi | 硬件中断占用 |
si | 软件中断占用 |
st | 虚拟化占用 |
第四行内存信息 | 说明 |
---|---|
total | 总内存空间 |
free | 空闲内存 |
used | 已用内存 |
buff/cache | 物理内存和交换内存的缓冲区总和 |
第五行交换空间信息 | 说明 |
---|---|
total | 总交换空间 |
free | 空闲交换空间 |
used | 已用交换空间 |
avail Mem | 可用物理空间 |
进程信息区各列名称 | 说明 |
---|---|
PID | 进程id |
USER | 进程所有者的用户名 |
PR | 优先级 |
NI | 谦让度值。负值表示高优先级,正值表示低优先级 |
VIRT | 进程使用的虚拟内存总量,单位kb |
RES | 进程使用的物理内存大小,单位kb |
SHR | 共享内存大小,单位kb |
s | 进程状态 |
%CPU | 上次更新到现在的CPU时间占用百分比 |
%MEM | 进程使用的物理内存百分比 |
TIME+ | 进程使用的CPU时间总计,单位1/100秒 |
COMMAND | 命令名/命令行 |
top -H ###显示所有线程
top -H -p <pid> ###显示指定pid号的进程中的线程
3)根据特定条件查询进程信息
pgrep -l “xx”
###查找名字带有xx的进程,l显示进程名,缺省时只输出PID号
pgrep -l -U xxx -t ttyN
-U指定特定用户,-t指定终端
4)查看进程树
pstree -aup
-a显示完整信息,-u列出对应用户名,-p列出对应PID号
pstree -aup XXX
只查看属于XXX用户的进程树结构
3.查看load average
查看load average有哪些命令 |
---|
top |
w |
uptime |
二、控制进程
1.进程的启动方式
1)手动启动
①前台启动:用户输入命令,直接执行程序
②后台启动:在命令行尾加入“&”符号
2)调度启动
①使用at命令,设置一次性计划任务
②使用crontab命令,设置周期性计划任务
2.进程的前后台调度
1)Ctrl + Z 组合键
将当前进程挂起,即调入后台并停止执行
2)jobs命令
查看处于后台的任务列表
jobs [-l] ###-l显示进程名
3)fg命令
将后台进程恢复到前台运行,可指定任务序号
fg [n] ###n为后台任务序号
3.中止进程的运行
1)Ctrl + C组合键
中断正在执行的命令
2)kill、killall命令
①kill用于终止指定PID号的进程
②killall用于终止指定名称相关的所有进程
③-9选项用于强制终止
kill命令符选项 | 说明 |
---|---|
-1 SIGHUP | 重新加载某个进程 |
-3 SIGQUIT | 告诉进程保存日志后关闭退出 |
-9 SIGKILL | 表示进程被终止,需要立即退出(不可被捕获也不能被忽略) |
-15 SIGTERM | 告诉进程你需要被关闭,请自行停止运行并推出 (可被捕获也能被忽略) |
kill [-n] -s <信号名> <PID>
###-n:选择发送指定的信号给进程,n为信号数,默认15
###-s:选择发送指定的信号给进程,参数为信号数对应的信号名,默认为SIGTERN
###PID:杀死指定PID的进程
killall <进程名> ###关闭所有用户的指定进程
3)pkill命令
①根据特定条件终止相应的进程
②常用命令选项
pkill <关键词> -U “XXX” -t “XXX”
关键词:根据关键词关闭所有带关键词的进程
-U:根据进程所属的用户名终止相应进程
-t:根据进程所在的终端终止相应进程
三、at一次性任务设置
at [HH:MM] [yyyy-mm-dd]
Ctrl + D ###提交任务
四、crontab周期性任务设置
1.按照预先设置的时间周期(分、时、日、月、周)重复执行用户指定的命令操作
2.属于周期性计划任务
3.主要设置文件
1)全局配置文件,位于文件:/etc/crontab
2)系统默认的设置,位于目录:/etc/cron.*/
3)用户定义的设置,位于文件:/var/spool/cron/用户名同名文件
crontab -e [-u 用户名]
###编辑计划任务,可指定用户,缺省时为针对当前用户
vim /var/spool/cron/用户同名文件
###编辑计划任务
echo '* * * * * /usr/bin/ls' >> /var/spool/cron/用户同名文件
###编辑计划任务
crontab -l [-u 用户名]
###查看计划任务,可指定用户,缺省时为针对当前用户
crontab -r [-u 用户名]
###删除计划任务,可指定用户,缺省时为针对当前用户
时间数值的特殊标识方法 | 说明 |
---|---|
* | 表示该范围内的任意时间 |
, | 表示间隔的多个不连续时间点 |
- | 表示一个连续的时间范围 |
/ | 指定间隔的时间频率 |
crontab任务配置 | ||||||
---|---|---|---|---|---|---|
代表意义 | 分钟 | 小时 | 日期 | 月份 | 周 | 命令 |
数字范围 | 0~59 | 0~23 | 1~31 | 1~12 | 0~7 | 需要执行的命令 |
周的数字0或7都为“星期天”
五、补充
1.如何检测I/O
在衡量磁盘性能时,我们经常提到五个常见指标:利用率、饱和度、IOPS、吞吐量和响应时间。这五个指标是衡量磁盘性能的基本指标。
利用率(Utilization):磁盘处理 I/O 的时间百分比。过度使用(如超过 80%)通常意味着磁盘 I/O 存在性能瓶颈。
饱和度(Saturation):指磁盘处理 I/O 的繁忙程度。过度饱和意味着磁盘存在严重的性能瓶颈。当饱和度为 100% 时,磁盘无法接受新的 I/O 请求。
IOPS(Input/Output Per Second):指每秒 I/O 请求的数量。
吞吐量(Throughput):每秒 I/O 请求的大小。
响应时间(Response time):指发送 I/O 请求和接收响应之间的间隔时间
iostat
vmstat
sar
2.平均负载
在 Linux 系统中,系统负载表示系统中当前正在运行的进程数量,其包括可运行状态的进程数和不可中断休眠状态的进程数的和。注意:不可中断休眠状态的进程一般是在等待 I/O 完成的进程。
系统负载 = 可运行状态进程数 + 不可中断休眠状态进程数
若每5秒统计一次系统负载,一分钟就为12次
5分钟为60次,15分钟为180次
平均负载 = 12次、60次、180次系统负载统计合/12次、60次、180次
时间越近的数据,对未来的预测准确性越高
3.常用的 Load 分析方法
1.CPU高、Load高
通过 top 命令查找占用CPU最高的进程PID;
通过top -Hp PID查找占用CPU最高的线程TID;
2.CPU低、Load高
产生的原因一句话总结就是:等待磁盘I/O完成的进程过多,导致进程队列长度过大,但是CPU运行的进程却很少,这样就体现到负载过大了,cpu使用率低。
通过top命令查看CPU等待IO时间,即%wa;
通过iostat -d -x -m 1 10查看磁盘IO情况;(安装命令 yum install -y sysstat)
通过sar -n DEV 1 10查看网络IO情况;
通过如下命令查找占用IO的程序;
ps -e -L h o state,cmd | awk '{if($1=="R"||$1=="D"){print $0}}' | sort | uniq -c | sort -k 1nr