Linux系统编程 -- 进程间通信

最新推荐文章于 2023-01-05 21:26:20 发布

帅中的小灰灰

最新推荐文章于 2023-01-05 21:26:20 发布

阅读量183

点赞数

分类专栏： Shell Linux C/C++ 文章标签： linux 服务器网络

本文链接：https://blog.csdn.net/weixin_44311159/article/details/127702706

版权

Shell 同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

Linux C/C++

17 篇文章 1 订阅

订阅专栏

进程间通信

文章目录

进程间通信
IPC方法
管道
共享存储映射

IPC方法

Linux 环境下，进程地址空间相互独立，每个进程各自有不同的用户地址空间。任何一个进程的全局变量在另一个
进程中都看不到，所以进程和进程之间不能相互访问，要交换数据必须通过内核，在内核中开辟一块缓冲区，进程 1 把数据从用户空间拷到内核缓冲区，进程 2 再从内核缓冲区把数据读走，内核提供的这种机制称为进程间通
信（IPC，InterProcess Communication）。

在这里插入图片描述

在进程间完成数据传递需要借助操作系统提供特殊的方法，如：文件、管道、信号、共享内存、消息队列、套
接字、命名管道等。随着计算机的蓬勃发展，一些方法由于自身设计缺陷被淘汰或者弃用。现今常用的进程间通信
方式有：
① 管道 (使用最简单)
② 信号 (开销最小)
 ③ 共享映射区 (无血缘关系)
④ 本地套接字 (最稳定)

管道

管道的概念：

管道是一种最基本的 IPC 机制，作用于有血缘关系的进程之间，完成数据传递。调用 pipe 系统函数即可创建一
个管道。有如下特质：
1. 其本质是一个伪文件(实为内核缓冲区) 
2. 由两个文件描述符引用，一个表示读端，一个表示写端。
3. 规定数据从管道的写端流入管道，从读端流出。

管道的原理: 管道实为内核使用环形队列机制，借助内核缓冲区(4k)实现。
管道的局限性：
① 数据不能进程自己写，自己读。
② 管道中数据不可反复读取。一旦读走，管道中不再存在。
③ 采用半双工通信方式，数据只能在单方向上流动。
④ 只能在有公共祖先的进程间使用管道。
常见的通信方式有，单工通信、半双工通信、全双工通信。


pipe 函数
创建管道
 int pipe(int pipefd[2]); 成功：0；失败：-1，设置 errno
函数调用成功返回 r/w 两个文件描述符。无需 open，但需手动 close。规定：fd[0] → r； fd[1] → w，就像 0
对应标准输入，1 对应标准输出一样。向管道文件读写数据其实是在读写内核缓冲区。	

1. 父进程调用 pipe 函数创建管道，得到两个文件描述符 fd[0]、fd[1]指向管道的读端和写端。
2. 父进程调用 fork 创建子进程，那么子进程也有两个文件描述符指向同一管道。
3. 父进程关闭管道读端，子进	程关闭管道写端。父进程可以向管道中写入数据，子进程将管道中的数据读出。
由于管道是利用环形队列实现的，数据从写端流入管道，从读端流出，这样就实现了进程间通信。

管道的读写行为

使用管道需要注意以下 4 种特殊情况（假设都是阻塞 I/O 操作，没有设置 O_NONBLOCK 标志）：
1. 如果所有指向管道写端的文件描述符都关闭了（管道写端引用计数为 0），而仍然有进程从管道的读端读数
据，那么管道中剩余的数据都被读取后，再次 read 会返回 0，就像读到文件末尾一样。

2. 如果有指向管道写端的文件描述符没关闭（管道写端引用计数大于 0），而持有管道写端的进程也没有向管道
中写数据，这时有进程从管道读端读数据，那么管道中剩余的数据都被读取后，再次 read 会阻塞，直到管道中有
数据可读了才读取数据并返回。

3. 如果所有指向管道读端的文件描述符都关闭了（管道读端引用计数为 0），这时有进程向管道的写端 write，
那么该进程会收到信号 SIGPIPE，通常会导致进程异常终止。当然也可以对 SIGPIPE 信号实施捕捉，不终止进程。具体方法信号章节详细介绍。
4. 如果有指向管道读端的文件描述符没关闭（管道读端引用计数大于 0），而持有管道读端的进程也没有从管道中
读数据，这时有进程向管道写端写数据，那么在管道被写满时再次 write 会阻塞，直到管道中有空位置了才写入数
据并返回。

总结：
① 读管道： 1. 管道中有数据，read 返回实际读到的字节数。
6. 管道中无数据：
(1) 管道写端被全部关闭，read 返回 0 (好像读到文件结尾)
(2) 写端没有全部被关闭，read 阻塞等待(不久的将来可能有数据递达，此时会让出 cpu)
 ② 写管道： 1. 管道读端全部被关闭， 进程异常终止(也可使用捕捉 SIGPIPE 信号，使进程不终止)
7. 管道读端没有全部关闭：
(1) 管道已满，write 阻塞。
(2) 管道未满，write 将数据写入，并返回实际写入的字节数。

管道缓冲区大小

可以使用 ulimit –a 命令来查看当前系统中创建管道文件所对应的内核缓冲区大小。通常为：
pipe size (512 bytes, -p) 8

也可以使用 fpathconf 函数，借助参数 选项来查看。使用该宏应引入头文件<unistd.h>
long fpathconf(int fd, int name); 成功：返回管道的大小 失败：-1，设置 errno

管道的优劣

优点：简单，相比信号，套接字实现进程间通信，简单很多。
缺点：
	1. 只能单向通信，双向通信需建立两个管道。
	2. 只能用于父子、兄弟进程(有共同祖先)间通信。该问题后来使用 fifo 有名管道解决。	

FIFO 
FIFO 常被称为命名管道，以区分管道(pipe)。管道(pipe)只能用于“有血缘关系”的进程间。但通过 FIFO，不相
关的进程也能交换数据。

FIFO 是 Linux 基础文件类型中的一种。但，FIFO 文件在磁盘上没有数据块，仅仅用来标识内核中一条通道。各
进程可以打开这个文件进行 read/write，实际上是在读写内核通道，这样就实现了进程间通信。
创建方式：
1. 命令：mkfifo 管道名
2. 库函数：int mkfifo(const char *pathname, mode_t mode); 成功：0； 失败：-1

一旦使用 mkfifo 创建了一个 FIFO，就可以使用 open 打开它，常见的文件 I/O 函数都可用于 fifo。如：close、read、
write、unlink 等。

共享存储映射

文件进程间通信

使用文件也可以完成 IPC，理论依据是，fork 后，父子进程共享文件描述符。也就共享打开的文件

存储映射 I/O

存储映射 I/O (Memory-mapped I/O) 使一个磁盘文件与存储空间中的一个缓冲区相映射。于是当从缓冲区中取
数据，就相当于读文件中的相应字节。于此类似，将数据存入缓冲区，则相应的字节就自动写入文件。这样，就可
在不适用 read 和 write 函数的情况下，使用地址（指针）完成 I/O 操作。使用这种方法，首先应通知内核，
将一个指定文件映射到存储区域中。这个映射工作可以通过 mmap 函数来实现。

在这里插入图片描述

mmap 函数

void *mmap(void *adrr, size_t length, int prot, int flags, int fd, off_t offset); 
返回：成功：返回创建的映射区首地址；
	 失败：MAP_FAILED 宏
参数：
addr: 建立映射区的首地址，由 Linux 内核指定。使用时，直接传递 NULL
length： 欲创建映射区的大小
prot： 映射区权限 PROT_READ、PROT_WRITE、PROT_READ|PROT_WRITE
flags： 标志位参数(常用于设定更新物理区域、设置共享、创建匿名映射区)
 	MAP_SHARED: 会将映射区所做的操作反映到物理设备（磁盘）上。
 	MAP_PRIVATE: 映射区所做的修改不会反映到物理设备。
fd： 用来建立映射区的文件描述符
offset： 映射文件的偏移(4k 的整数倍)

munmap 函数

同 malloc 函数申请内存空间类似的，mmap 建立的映射区在使用结束后也应调用类似 free 的函数来释放。
int munmap(void *addr, size_t length); 成功：0； 失败：-1

mmap 注意事项

思考：
1. 可以 open 的时候 O_CREAT 一个新文件来创建映射区吗?
2. 如果 open 时 O_RDONLY，mmap 时 PROT 参数指定 PROT_READ|PROT_WRITE 会怎样？
3. 文件描述符先关闭，对 mmap 映射有没有影响？
4. 如果文件偏移量为 1000 会怎样？
5. 对 mem 越界操作会怎样？
6. 如果 mem++，munmap 可否成功？
7. mmap 什么情况下会调用失败？
8. 如果不检测 mmap 的返回值，会怎样？


总结：使用 mmap 时务必注意以下事项：
1. 创建映射区的过程中，隐含着一次对映射文件的读操作。
2. 当 MAP_SHARED 时，要求：映射区的权限应 <= 文件打开的权限(出于对映射区的保护)。而 MAP_PRIVATE
则无所谓，因为 mmap 中的权限是对内存的限制。
3. 映射区的释放与文件关闭无关。只要映射建立成功，文件可以立即关闭。
4. 特别注意，当映射文件大小为 0 时，不能创建映射区。所以：用于映射的文件必须要有实际大小！！
mmap 使用时常常会出现总线错误，通常是由于共享文件存储空间大小引起的。如，400 字节大小的文件，
在建立映射区时 offset 4096 字节，则会报出总线错。
5. munmap 传入的地址一定是 mmap 的返回地址。坚决杜绝指针++操作。
6. 文件偏移量必须为 4K 的整数倍
7. mmap 创建映射区出错概率非常高，一定要检查返回值，确保映射区建立成功再进行后续操作。

mmap 父子进程通信

父子等有血缘关系的进程之间也可以通过 mmap 建立的映射区来完成数据通信。但相应的要在创建映射区的时候
指定对应的标志位参数 flags：
MAP_PRIVATE: (私有映射) 父子进程各自独占映射区；
MAP_SHARED: (共享映射) 父子进程共享映射区；

结论：父子进程共享：1. 打开的文件 2. mmap 建立的映射区(但必须要使用 MAP_SHARED)

mmap 无血缘关系进程间通信

实质上 mmap 是内核借助文件帮我们创建了一个映射区，多个进程之间利用该映射区完成数据传递。由于内核空间
多进程共享，因此无血缘关系的进程间也可以使用 mmap 来完成通信。只要设置相应的标志位参数 flags 即可。
若想实现共享，当然应该使用 MAP_SHARED 了。
	
值得注意的是：MAP_ANON 和 /dev/zero 都不能应用于非血缘关系进程间通信。只能用于亲子进程间

匿名映射

通过使用我们发现，使用映射区来完成文件读写操作十分方便，父子进程间通信也较容易。但缺陷是，每次创建映射
区一定要依赖一个文件才能实现。通常为了建立映射区要 open 一个 temp 文件，创建好了再 unlink、close掉比
较麻烦。 可以直接使用匿名映射来代替。其实 Linux 系统给我们提供了创建匿名映射区的方法，无需依赖一个文件即可创建映射区。同样需要借助标志位参数 flags 来指定。

使用 MAP_ANONYMOUS (或 MAP_ANON)， 如: 
int *p = mmap(NULL, 4, PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANONYMOUS, -1, 0); 
 "4"随意举例，该位置表大小，可依实际需要填写。
 
需注意的是，MAP_ANONYMOUS 和 MAP_ANON 这两个宏是 Linux 操作系统特有的宏。在类 Unix 系统中如无该
宏定义，可使用如下两步来完成匿名映射区的建立。
① fd = open("/dev/zero", O_RDWR);
② p = mmap(NULL, size, PROT_READ|PROT_WRITE, MMAP_SHARED, fd, 0);