1、背景:多进程
由fork创建的新进程被称为子进程(child process)。该函数被调用一次,但返回两次。两次返回的区别是子进程的返回值是0,而父进程的返回值则是新进程(子进程)的进程 id。将子进程id返回给父进程的理由是:因为一个进程的子进程可以多于一个,没有一个函数使一个进程可以获得其所有子进程的进程id。对子进程来说,之所以fork返回0给它,是因为它随时可以调用getpid()来获取自己的pid;也可以调用getppid()来获取父进程的id。(进程id 0总是由交换进程使用,所以一个子进程的进程id不可能为0 )。
fork之后,操作系统会复制一个与父进程完全相同的子进程,虽说是父子关系,但是在操作系统看来,他们更像兄弟关系,这2个进程共享代码空间,但是数据空间是互相独立的,子进程数据空间中的内容是父进程的完整拷贝,指令指针也完全相同,子进程拥有父进程当前运行到的位置(两进程的程序计数器pc值相同,也就是说,子进程是从fork返回处开始执行的),但有一点不同,如果fork成功,子进程中fork的返回值是0,父进程中fork的返回值是子进程的进程号,如果fork不成功,父进程会返回错误。
可以这样想象,2个进程一直同时运行,而且步调一致,在fork之后,他们分别作不同的工作,也就是分岔了。这也是fork为什么叫fork的原因。至于哪一个最先运行,可能与操作系统(调度算法)有关,而且这个问题在实际应用中并不重要,如果需要父子进程协同,可以通过原语的办法解决。
Q1:为什么要有进程间通信?
1、为了传输数据:一个进程需要将它的数据发送给另外一个进程;
2、为了共享资源:多个进程之间有时需要共享同样的一份资源;
3、为了通知事件:一个进程需要向另一个进程或者进程组发送消息通知他们发生了某些事件(比如:一个进程退出时需要通知他的父进程);
4、为了实现进程控制:有些进程希望控制另一个进程的执行,此时控制进程希望能够拦截另外一个进程的所有陷入和异常,并能够及时知道他的状态改变。
Q2:进程间通信的本质是什么?
不同的两个进程之间,他们的进程地址空间自然也是相互独立的,而进程间通信就是为了让两个进程之间能够共同的知晓某一份数据、消息等这些资源。一句话就是:进程间通信的本质就是:让不同的进程可以看到同一份资源。
- 常见的通信方式
每个进程各自有不同的用户地址空间,任何一个进程的全局变量在另一个进程中都看不到,所以进程之间要交换数据必须通过内核,在内核中开辟一块缓冲区,进程A把数据从用户空间拷到内核缓冲区,进程B再从内核缓冲区把数据读走,内核提供的这种机制称为进程间通信。
不同进程间的通信本质:进程之间可以看到一份公共资源;而提供这份资源的形式或者提供者不同,造成了通信方式不同。
2.1管道
把从一个进程连接到另一个进程的一个数据流称为一个管道。管道又分为命名管道和匿名管道。
匿名管道:只允许具有亲缘关系的进程间通信。
命名管道:允许不相关的进程之间进行通信。
管道是一种特殊的文件,不属于一种文件系统,而是一种独立的文件系统,有自己的数据结构,根据管道的使用范围划分为无名管道和命名管道。
2.1.1 无名管道pipe:
管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。
无名管道用于父进程和子进程之间,通常父进程创建管道,然后由通信的子进程继承父进程的读端点句柄和写端点句柄,或者父进程有读写句柄的子进程,这些子进程可以使用管道直接通信,不需要通过父进程。
2.1.2 高级管道popen:
将另一个程序当做一个新的进程在当前程序进程中启动,则它算是当前程序的子进程,这种方式我们成为高级管道方式。
2.1.33. 命名管道FIFO:
有名管道也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。
命名管道是为了解决无名管道只能在父子进程间通信而设计的,命名管道是建立在实际的磁盘介质或文件系统(而不是只存在内存中),任何进程可以通过文件名或路径建立与该文件的联系,命名管道需要一种FIFO文件(有先进先出的原则),虽然FIFO文件的inode节点在磁盘上,但仅是一个节点而已,文件的数据还是存在于内存缓冲页面中,和普通管道相同。
特点:
(1)只能用于具有共同祖先的进程(具有亲缘关系的进程)之间进行通信;通常情况下,一个管道有一个进程创建,然后该进程调用fork,此后父进程与子进程就可应用该管道。
(2)管道提供流式服务(面向字节流)。
(3)一般而言,进程退出,管道释放,所以管道的生命周期随进程。
(4)内核会对管道操作进行同步与互斥。
(5)管道是半双工的,数据只能向一个方向流动,需要双方通信时,要建立起两个管道。
Q3:管道如何实现进程间的通信?
(1)父进程创建管道,得到两个文件描述符指向管道的两端 int pipe(int fd[2]);//创建管道,fd[0]读端,fd[1]写
(2)父进程fork出子进程,子进程也有两个文件描述符指向同一个管道。
(3)父进程关闭fd[0],子进程关闭fd[1],即父进程关闭管道读端,子进程关闭管道写端(因为管道只支持单向通信)。父进程可以往管道写,子进程可以从管道读,管道是环形队列实现的,数据从写端流入从读端流出,这样就实现了进程间通信。
Q4:管道读取数据的四种情况
(1)读端不读,写端一直写
(2)写端不写,但是读端一直读
(3)读端一直读,且fd[0]保持打开,而写端写了一部分数据不写了,并且关闭fd[1]
(4)读端读了一部分数据,不读了且关闭fd[0],写端一直在写且f[1]还保持打开状态。
总结:
如果一个管道的写端一直在写,而读端的引用计数是否大于0决定管道是否会堵塞,引用计数大于0,只写不读再次调用write会导致管道堵塞;
如果一个管道的读端一直在读,而写端的引用计数是否大于0决定管道是否会堵塞,引用计数大于0,只读不写再次调用read会导致管道堵塞;
而当他们的引用计数等于0时,只写不读会导致写端的进程收到一个SIGPIPE信号,导致进程终止,只读不写会导致read返回0,就像读到文件末尾一样。
2.2消息队列MessageQueue
消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。消息队列提供了一种在两个不相关的进程之间传递数据的简单高效的方法。
消息队列是消息的链表,包括Posix消息队列和system v消息队列(Posix常用于线程,system常用于进程),有写权限的进程可以向消息队列中添加消息,有读权限的进程可以读走消息队列的消息。
特点:
(1)它提供有格式的字节流,减少了开发人员的工作量;消息具有类型(system V)或优先级(posix)。其他方式都没有这些优点。
(2)具备同步机制。
(3)生命周期随内核。
(4)消息队列允许一个或多个进程向它写入或者读取消息。
(5)与无名管道、命名管道一样,从消息队列中读出消息,消息队列中对应的数据都会被删除。
(6)每个消息队列都有消息队列标识符,消息队列的标识符在整个系统中是唯一的。
消息队列是消息的链表,存放在内存中,由内核维护。只有内核重启或人工删除消息队列时,该消息队列才会被删除。若不人工删除消息队列,消息队列会一直存在于系统中。
2.3共享内存SharedMemory:
共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问(使多个进程可以访问同一块内存空间)。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号量,配合使用,来实现进程间的同步和通信。
特点:
(1)共享内存没有提供任何的保护机制
(2)是临界资源
(3)没有同步互斥机制
(4)生命周期随内核(同消息队列)
2.4 信号量Semaphore:
信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。
特点:
(1)本质是一个计数器,内存中有多少个临界资源,信号量的数字就是多少。
(2)信号量基于操作系统的 PV 操作,程序对信号量的操作都是原子操作
(3)信号量用于进程间同步,若要在进程间传递数据需要结合共享内存。
2.5信号 sinal :
信号是Linux系统中用于进程之间通信或操作的一种机制,信号可以在任何时候发送给某一进程,而无须知道该进程的状态。如果该进程并未处于执行状态,则该信号就由内核保存起来,直到该进程恢复执行并传递给他为止。如果一个信号被进程设置为阻塞,则该信号的传递被延迟,直到其阻塞被取消时才被传递给进程。信号是一种比较复杂的通信方式,用于通知接收进程某个事件已经发生。除了用于进程间通信之外,进程还可以发送信号给进程本身。除了系统内核和root之外,只有具备相同id的进程才可以信号进行通信。
信号是在软件层次上对中断机制的一种模拟,是一种异步通信方式,信号可以在用户空间进程和内核之间直接交互。内核也可以利用信号来通知用户空间的进程来通知用户空间发生了哪些系统事件。信号事件有两个来源:
1)硬件来源,例如按下了cltr+C,通常产生中断信号sigint
2)软件来源,例如使用系统调用或者命令发出信号。最常用的发送信号的系统函数是kill,raise,setitimer,sigation,sigqueue函数。软件来源还包括一些非法运算等操作。
一旦有信号产生,用户进程对信号产生的响应有三种方式:
1)执行默认操作,linux对每种信号都规定了默认操作。
2)捕捉信号,定义信号处理函数,当信号发生时,执行相应的处理函数。
3)忽略信号,当不希望接收到的信号对进程的执行产生影响,而让进程继续执行时,可以忽略该信号,即不对信号进程作任何处理。注意:有两个信号是应用进程无法捕捉和忽略的,即SIGKILL和SEGSTOP,这是为了使系统管理员能在任何时候中断或结束某一特定的进程。
2.6套接字Socket:
套接字也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同机器间的进程通信。
通信过程如下:
(1)命名socket
SOCK_STREAM 式本地套接字的通信双方均需要具有本地地址,其中服务器端的本地地址需要明确指定,指定方法是使用 struct sockaddr_in 类型的变量。
(2) 绑定
SOCK_STREAM 式本地套接字的通信双方均需要具有本地地址,其中服务器端的本地地址需要明确指定,指定方法是使用 struct sockaddr_in 类型的变量,将相应字段赋值,再将其绑定在创建的服务器套接字上,绑定要使用 bind 系统调用,其原形如下:
int bind(int socket, const struct sockaddr *address, size_t address_len);
其中 socket表示服务器端的套接字描述符,address 表示需要绑定的本地地址,是一个 struct sockaddr_in 类型的变量,address_len 表示该本地地址的字节长度。
- 监听
服务器端套接字创建完毕并赋予本地地址值(名称,本例中为Server Socket)后,需要进行监听,等待客户端连接并处理请求,监听使用 listen 系统调用,接受客户端连接使用accept系统调用,它们的原形如下:
int listen(int socket, int backlog);
int accept(int socket, struct sockaddr *address, size_t *address_len);
其中 socket 表示服务器端的套接字描述符;backlog 表示排队连接队列的长度(若有多个客户端同时连接,则需要进行排队);address 表示当前连接客户端的本地地址,该参数为输出参数,是客户端传递过来的关于自身的信息;address_len 表示当前连接客户端本地地址的字节长度,这个参数既是输入参数,又是输出参数。
- 连接服务器
客户端套接字创建完毕并赋予本地地址值后,需要连接到服务器端进行通信,让服务器端为其提供处理服务。
对于SOCK_STREAM类型的流式套接字,需要客户端与服务器之间进行连接方可使用。连接要使用 connect 系统调用,其原形为int connect(int socket, const struct sockaddr *address, size_t address_len);
其中socket为客户端的套接字描述符,address表示目标服务器端的变量地址,是一个 struct sockaddr_in 类型的变量,address_len 表示服务器变量地址的字节长度。实现连接的代码如下:
connect(client_sockfd, (struct sockaddr*)&serv_address, sizeof(serv_address));
- 相互发送接收数据
无论客户端还是服务器,都要和对方进行数据上的交互,这种交互也正是我们进程通信的主题。一个进程扮演客户端的角色,另外一个进程扮演服务器的角色,两个进程之间相互发送接收数据,这就是基于本地套接字的进程通信。发送和接收数据要使用 write 和 read 系统调用,它们的原形为:
int read(int socket, char *buffer, size_t len);
int write(int socket, char *buffer, size_t len);
其中 socket 为套接字描述符;len 为需要发送或需要接收的数据长度;对于 read 系统调用,buffer 是用来存放接收数据的缓冲区,即接收来的数据存入其中,是一个输出参数;对于 write 系统调用,buffer 用来存放需要发送出去的数据,即 buffer 内的数据被发送出去,是一个输入参数;返回值为已经发送或接收的数据长度。
- 断开连接
交互完成后,需要将连接断开以节省资源,使用close系统调用,其原形为:int close(int socket);
通信方式优缺点总结:
1.管道:速度慢,容量有限,只能用于具有亲缘关系的进程间通信。
2.FIFO:任何进程间都能通信,但速度慢。
3.消息队列:容量受到系统限制。
4.信号量:不能传递复杂消息,只能用来同步。
5.共享内存区:能够很容易控制容量,速度快,但要保持同步。