进程
Linux下查看进程
- ps aux
- ps -ef
- top
- pstree
- ps axj
什么是进程
概念‘
程是程序的一次动态执行过程,包括创建、调度、消亡
进程和程序的区别
程序(a.out)是静态的,它是一些保存在磁盘上的指令的有序集合,没有任何执行的概念
进程(./a.out)是一个动态的概念,它是程序执行的过程,包括创建、调度和消亡
进程是程序执行和资源(内存)管理的最小单位
为什么说进程是程序执行和资源管理的最小单位?
因为每一个进程都有一个0~4G的虚拟内存
为什么要有虚拟内存?--->多任务、安全
如何区分不同的进程-->PID(进程号)
进程是由进程创建的,我们有父进程和子进程
进程的类型
交互进程:该类进程是由shell控制和运行的。交互进程既可以在前台运行,也可以在后台运行。
交互进程:该类进程是由shell控制和运行的。交互进程既可以在前台运行,也可以在后台运行。
守护进程:该类进程在后台运行。它一般在Linux启动时开始执行,系统关闭时才结束。
进程运行状态
(1)运行态:此时进程或者正在运行,或者准备运行。
(2)等待态:此时进程在等待一个事件的发生或某种系统资源。
可中断
不可中断
(3)停止态:此时进程被中止。
(4)僵死态:这是一个已终止的进程,但还在进程向量数组中占有一个task_struct结构体。
为了更好的管理Linux所访问的资源,系统在内核头文件include/linux/sched.h定义了进程控制块(PCB)结构体task_struct来管理每个进程的资源
内核空间进程资源即PCB相关的信息,包括进程控制块本身,打开的文件表项、当前目录、当前终端信息、线程基本信息、可以访问内存地址空间、PID、PPID、UID、EUID等,也就是说,内核通过PCB结构体可以访问到进程的所有资源信息
(5)死亡态
进程的模式
进程相关的的系统调用
fork
注意:fork之后,父进程和子进程存在资源竞争的关系,谁先调度由调度算法来决定
注意:子进程执行是在fork函数的返回处
getpid、getppid
进程退出
exit、_exit、return(主函数的return)
孤儿进程
父进程先于子进程退出,子进程会被systemd进程收养,子进程会变成后台进程
僵尸进程
子进程先退出,父进程没有及时回收子进程的资源(PCB结构体),此时就成为了僵尸进程
注意:父进程不退出,子进程会一直保持僵死状态,直到父进程退出,被systemd回收
wait、waitpid
如何避免僵尸进程,子进程退出时父进程及时回收子进程的资源,可以调用wait或者waitpid
wait
waitpid
exec函数族
l:list 以列表的形式传参
v:vector 数组
p:path 系统会自动从环境变量“$PATH”所包含的路径中进行查找。
守护进程
特点
- 从系统启动开始运行,系统关闭时停止运行
- 后台进程,与终端无关
想要实现守护进程:
(1)不能和终端具有亲缘关系
(2)与终端无关,也就是要把控制终端变成?
守护进程的创建步骤
(1)创建子进程,父进程退出
(2)在子进程中创建新会话
(3)改变当前目录为根目录
(4)重设文件权限掩码
(5)关闭文件描述符
通信的相关概念
通信的模式
单工:A-->B (键盘输入)
半双工:A--->B 或者 B--->A (对讲机)
双工:A--->B 同时 B-->A(打电话)
同步:(走路)
异步:(外卖)
通信协议
双方约定好的规则
通信方式
无名管道
相关概念
创建无名管道
为什么无名管道只能用于具有亲缘关系间的进程的通信?
无名管道没有名字,不同的进程无法获取同一个文件描述符,具有亲缘关系的进程之间可以继承,从而得到同一个文件描述符。
注意:
(1)当管道中无数据时,读操作会阻塞
(2)向管道中写入数据时,linux将不保证写入的原子性,管道缓冲区一有空闲区域,写进程就会试图向管道写入数据。如果读进程不读走管道缓冲区中的数据,那么写操作将会一直阻塞。
(3)只有在管道的读端存在时,向管道中写入数据才有意义。否则,向管道中写入数据的进程将收到内核传来的SIGPIPE信号(通常Broken pipe错误)-->管道破裂
测试管道破裂
有名管道
相关概念
创建有名管道
注意:只有读端或者写端存在的时候,系统会阻塞,直到有另一个进程(包括自己)以另一种方式打开管道
信号
相关概念
列出所有的信号
信号安装 or 信号注册函数
案例1:忽略信号
案例2:采用默认操作
案例3:自定义信号处理函数
案例:通过信号回收子进程
alarm
alarm()也称为闹钟函数,它可以在进程中设置一个定时器。当定时器指定的时间到时,内核就向进程发送SIGALARM信号
pause
kill
发送信号给进程或进程组
raise
raise函数允许进程向自己发送信号
共享内存
相关概念
SystemV提供的IPC机制主要由消息队列、共享内存、信号量3中机制。和文件一样,IPC在使用前必须先创建,每种IPC都有特定的生产者、所有者和访问权限。使用ipcs命令查看当前系统正在使用的IPC工具
共享内存的创建步骤
(1)创建/打开共享内存
(2)映射共享内存,即把指定的共享内存映射到进程的地址空间用于访问
(3)撤销共享内存映射
(4)删除共享内存对象
使用信号实现同步:
读端:
写端:
有名信号量
有名信号量:进程间的同步
无名信号量:线程间的同步
创建一个有名信号量
sem_wait( ):P操作 -1
sem_wait在信号量大于0时,它将这个信号量的值减1,若信号量的值为0,sem_wait将会阻塞
sem_post( ):V操作 +1
sem_post相当与V操作,它将信号量的值加1,同时唤醒等待的进程
sem_close();
消息队列
相关概念
注意:消息类型不能为0
消息队列的创建步骤
- 创建并打开消息队列
添加消息
接收消息
删除消息队列
线程
线程的相关概念
创建线程
注意:线程之间也存在资源竞争的关系
线程的等待函数
将子线程设置为游离态
线程退出函数
多线程
同步
信号量初始化
P/V操作:
sem_wait( ):P操作 -1
sem_wait在信号量大于0时,它将这个信号量的值减1,若信号量的值为0,sem_wait将会阻塞
sem_post( ):V操作 +1
sem_post相当与V操作,它将信号量的值加1,同时唤醒等待的进程
注意:也可以保护临界资源的完整性,而且实现同步
互斥
步骤
创建锁
初始化锁
上锁
解锁
进程间的六种通信方式以及优缺点总结
管道(Pipes)
最简单的方式就是管道,管道的本质是存放在内存中的特殊的文件。也就是说,内核在内存中开辟了一个缓冲区,这个缓冲区与管道文件相关联,对管道文件的操作,被内核转换成对这块缓冲区的操作。管道分为无名管道和有名管道,无名管道只能在父子进程之间进行通信,而有名管道没有限制。
优点:易于实现和使用,适用于具有亲缘关系的进程之间的通信。
缺点:只能用于单向通信,无法进行双向通信;只能传输一些简单的数据类型。
消息队列(Message Queues)
虽然管道使用简单,但是效率比较低,不适合进程间频繁地交换数据,并且管道只能传输无格式的字节流。为此消息队列应用而生。消息队列的本质就是存放在内存中的消息的链表,而消息本质上是用户自定义的数据结构。如果进程从消息队列中读取了某个消息,这个消息就会被从消息队列中删除。
优点:消息的接收和发送没有严格的先后顺序,支持异步处理;可以进行数据存储。
缺点:消息类型比较单一,只能发送少量的数据。
共享内存(Shared Memory)
消息队列的速度比较慢,因为每次数据的写入和读取都需要经过用户态与内核态之间数据的拷贝过程,共享内存可以解决这个问题。所谓共享内存就是:两个不同进程的逻辑地址通过页表映射到物理空间的同一区域,它们所共同指向的这块区域就是共享内存。如果某个进程向共享内存写入数据,所做的改动将立即影响到可以访问同一段共享内存的任何其他进程。
对于共享内存机制来说,仅在建立共享内存区域时需要系统调用,一旦建立共享内存,所有的访问都可作为常规内存访问,无需借助内核。这样,数据就不需要在进程之间来回拷贝,所以这是最快的一种进程通信方式。
优点:速度快,可以进行大量数据的传输。
缺点:需要额外考虑同步机制,对于进程间同步比较复杂。
信号
信号和信号量是完全不同的两个概念!信号是进程通信机制中唯一的异步通信机制,它可以在任何时候发送信号给某个进程。通过发送指定信号来通知进程某个异步事件的发送,以迫使进程执行信号处理程序。信号处理完毕后,被中断进程将恢复执行。用户、内核和进程都能生成和发送信号。
信号量(Semaphores)
共享内存速度虽然非常快,但是存在冲突问题,为此,我们可以使用信号量和 PV 操作来实现对共享内存的互斥访问,并且还可以实现进程同步。
优点:可以用于多个进程之间进行同步和互斥控制。
缺点:容易出现死锁问题。
套接字(Sockets)
优点:可以进行网络通信,适用于不同主机之间的进程通信。
缺点:通信开销相对比较大。