Linux进程间通信

IPC方法

Linux 环境下,进程地址空间相互独立,每个进程各自有不同的用户地址空间。任何一个进程的全局变量在另一个进程中都看不到,所以进程和进程之间不能相互访问,要交换数据必须通过内核,在内核中开辟一块缓冲区,进程 1 把数据从用户空间拷到内核缓冲区,进程 2 再从内核缓冲区把数据读走,内核提供的这种机制称为进程间通信(IPC, InterProcess Communication)。
IPC
在进程间完成数据传递需要借助操作系统提供特殊的方法,如:文件、管道、信号、共享内存、消息队列、套接字、命名管道等。随着计算机的蓬勃发展,一些方法由于自身设计缺陷被淘汰或者弃用。现今常用的进程间通信方式有:
① 管道 (使用最简单)
② 信号 (开销最小)
③ 共享映射区 (无血缘关系)
④ 本地套接字 (最稳定)

管道

管道的概念

管道是一种最基本的 IPC 机制, 作用于有血缘关系的进程之间,完成数据传递。调用 pipe 系统函数即可创建一个管道。有如下特质:

  1. 其本质是一个伪文件(实为内核缓冲区)
  2. 由两个文件描述符引用,一个表示读端,一个表示写端。
  3. 规定数据从管道的写端流入管道,从读端流出。

管道的原理: 管道实为内核使用环形队列机制,借助内核缓冲区(4k)实现。

管道的局限性:

  1. 数据不能进程自己写,自己读。
  2. 管道中数据不可反复读取。一旦读走,管道中不再存在。
  3. 采用半双工通信方式,数据只能在单方向上流动。
  4. 只能在有公共祖先的进程间使用管道。

常见的通信方式有,单工通信、半双工通信、全双工通信。

pipe 函数

创建管道

int pipe(int fildes[2]);	// 成功:0,失败:-1,设置errno

例子:pipe.cpp
例子:pipe实现命令 ls | wc -l

函数调用成功返回 r/w 两个文件描述符。无需 open,但需手动 close。规定: fd[0] → r; fd[1] → w,就像 0对应标准输入, 1 对应标准输出一样。 向管道文件读写数据其实是在读写内核缓冲区。
管道创建成功以后, 创建该管道的进程(父进程) 同时掌握着管道的读端和写端。 如何实现父子进程间通信呢?
通常可以采用如下步骤:
pipe

  1. 父进程调用 pipe 函数创建管道,得到两个文件描述符 fd[0]、 fd[1]指向管道的读端和写端。
  2. 父进程调用 fork 创建子进程,那么子进程也有两个文件描述符指向同一管道。
  3. 父进程关闭管道读端,子进程关闭管道写端。父进程可以向管道中写入数据,子进程将管道中的数据读出。

由于管道是利用环形队列实现的,数据从写端流入管道,从读端流出,这样就实现了进程间通信。

管道的读写行为分析

使用管道需要注意以下 4 种特殊情况(假设都是阻塞 I/O 操作,没有设置 O_NONBLOCK 标志):

  1. 如果所有指向管道写端的文件描述符都关闭了(管道写端引用计数为0),而仍然有进程从管道的读端读数据,那么管道中剩余的数据都被读取后,再次 read 会返回 0,就像读到文件末尾一样。
  2. 如果有指向管道写端的文件描述符没关闭(管道写端引用计数大于 0),而持有管道写端的进程也没有向管道中写数据,这时有进程从管道读端读数据,那么管道中剩余的数据都被读取后,再次 read 会阻塞,直到管道中有数据可读了才读取数据并返回。
  3. 如果所有指向管道读端的文件描述符都关闭了(管道读端引用计数为0),这时有进程向管道的写端 write,那么该进程会收到信号 SIGPIPE,通常会导致进程异常终止。当然也可以对 SIGPIPE 信号实施捕捉,不终止进程。
  4. 如果有指向管道读端的文件描述符没关闭(管道读端引用计数大于 0),而持有管道读端的进程也没有从管道中读数据,这时有进程向管道写端写数据,那么在管道被写满时再次 write 会阻塞,直到管道中有空位置了才写入数据并返回。

总结
① 读管道:

  1. 管道中有数据, read 返回实际读到的字节数。
  2. 管道中无数据:
    (1) 管道写端被全部关闭, read 返回 0 (好像读到文件结尾)
    (2) 写端没有全部被关闭, read 阻塞等待(不久的将来可能有数据递达,此时会让出 cpu)

② 写管道:

  1. 管道读端全部被关闭, 进程异常终止(也可使用捕捉 SIGPIPE 信号,使进程不终止)
  2. 管道读端没有全部关闭:
    (1) 管道已满, write 阻塞。
    (2) 管道未满, write 将数据写入,并返回实际写入的字节数。

管道缓冲区大小

可以使用 ulimit –a 命令来查看当前系统中创建管道文件所对应的内核缓冲区大小。通常为:
pipe size (512 bytes, -p) 8
pipe
也可以使用 fpathconf 函数,借助参数 选项来查看。使用该宏应引入头文件<unistd.h>

long fpathconf(int fd, int name); //成功: 返回管道的大小 失败: -1, 设置 errno

管道的优缺点

优点:

  1. 简单,相比信号,套接字实现进程间通信,简单很多。

缺点:

  1. 只能单向通信,双向通信需建立两个管道。
  2. 只能用于父子、兄弟进程(有共同祖先)间通信。该问题后来使用 fifo 有名管道解决。

有名管道(FIFO)

例子:mkfifo_w.cpp mkfifo_r.cpp
FIFO 常被称为命名管道, 以区分管道(pipe)。管道(pipe)只能用于“有血缘关系”的进程间。但通过 FIFO,不相关的进程也能交换数据。
FIFO 是 Linux 基础文件类型中的一种。但, FIFO 文件在磁盘上没有数据块,仅仅用来标识内核中一条通道。各进程可以打开这个文件进行read/write, 实际上是在读写内核通道,这样就实现了进程间通信。

shell命令

mkfifo 管道名

mkfilo

int mkfifo(const char *pathname, mode_t mode); //成功: 0; 失败: -1
/*
 * 一旦使用 mkfifo 创建了一个 FIFO, 就可以使用 open 打开它.
 * 常见的文件 I/O 函数都可用于 fifo。 如: close、 read、write、 unlink 等。
 * /

共享存储映射

存储映射 I/O

存储映射 I/O (Memory-mapped I/O) 使一个磁盘文件与存储空间中的一个缓冲区相映射。 于是当从缓冲区中取数据, 就相当于读文件中的相应字节
于此类似, 将数据存入缓冲区, 则相应的字节就自动写入文件。 这样,就可在不适用 read 和 write 函数的情况下,使用(指针)地址完成 I/O 操作。
使用这种方法, 首先应通知内核, 将一个指定文件映射到存储区域中。 这个映射工作可以通过 mmap 函数来实现。
mmap

mmap函数详解

void *mmap(void *addr, size_t length, int prot, int flags,int fd, off_t offset);

/*
 * 参数: 
 * 		addr	指定映射区的首地址。通常传NULL,表示让系统自动分配
 * 		length	共享内存映射区的大小。( <= 文件的实际大小)
 * 		prot	共享内存映射区的读写属性。PROT_READ(只读)、PROT_WRITE(只写)、PROT_READ|PROT_WRITE(读写)
 * 		flags	标注共享内存的共享属性。MAP_SHARED(共享)、MAP_PRIVATE(私有)
 * 		fd		用于创建共享内存映射区的那个文件的文件描述符
 * 		offset	默认0,表示映射文件全部。偏移位置,必须是4k的整数倍
 *  
 * 返回值:
 * 		成功:映射区的首地址
 * 		失败:MAP_FALED(void*(-1)), 并设置errno [返回值 == MAP_FALED(宏)]
 */
int munmap(void *addr, size_t length);

/*
 * 参数: 
 * 		addr	需要释放的映射区的首地址。
 * 		length	释放的共享内存映射区的大小。
 * 
 * 返回值:
 * 		成功:0
 * 		失败: -1,并设置errno
 */

mmap 注意事项

  1. 创建映射区的过程中,隐含着一次对映射文件的读操作。(因此打开的文本必须具有可读权限)
  2. 当 MAP_SHARED 时,要求:映射区的权限应 <= 文件打开的权限(出于对映射区的保护)。而 MAP_PRIVATE则无所谓, 因为 mmap 中的权限是对内存的限制。
  3. 映射区的释放与文件关闭无关。只要映射建立成功,文件可以立即关闭。后续访问文件用地址访问
  4. 特别注意,当映射文件大小为 0 时,不能创建映射区。所以:用于映射的文件必须要有实际大小!!(因此代码中使用ftrucate()函数拓展了文件大小)
    mmap 使用时常常会出现总线错误,通常是由于共享文件存储空间大小引起的。 如, 400 字节大小的文件,在建立映射区时 offset 4096 字节,则会报出总线错。
  5. munmap 传入的地址一定是 mmap 的返回地址。坚决杜绝指针++操作。(如果逻辑中必须使用++操作,可以int *tmp = p; tmp++; 释放时传入指针p)
  6. 如果文件偏移量必须为 4K 的整数倍。(MMU映射的最小单位为4k)
  7. 映射区访问权限为”私有“MAP_PRIVATE,对内存所做的所有修改,只在内存中有效,不会反应到物理磁盘上。
  8. mmap 创建映射区出错概率非常高, 一定要检查返回值, 确保映射区建立成功再进行后续操作。\

mmap函数的保险调用方式

如果没有特殊需求都可以使用下述方式,完成共享内存映射。

fd = open("文件名", O_RDWR);
mmap(NULL, 有效文件的大小, PROI_READ | PROI_WRITE, MAP_SHARED, fd, 0);

mmap 父子进程通信

父子等有血缘关系的进程之间也可以通过 mmap 建立的映射区来完成数据通信。但相应的要在创建映射区的时候指定对应的标志位参数 flags:

  • MAP_PRIVATE: (私有映射) 父子进程各自独占映射区;
  • MAP_SHARED: (共享映射) 父子进程共享映射区;

例子:mmap.cpp

结论: 父子进程共享: 1. 打开的文件 2. mmap 建立的映射区(但必须要使用 MAP_SHARED)

mmap 无血缘关系进程间通信

实质上 mmap 是内核借助文件帮我们创建了一个映射区,多个进程之间利用该映射区完成数据传递。由于内核空间多进程共享,因此无血缘关系的进程间也可以使用 mmap 来完成通信。只要设置相应的标志位参数 flags 即可。

若想实现共享,当然应该使用MAP_SHARED了。

注意: MAP_ANON参数和 /dev/zero文件 都不能应用于非血缘关系进程间通信。 只能用于亲子进程间。

匿名映射

通过使用我们发现, 使用映射区来完成文件读写操作十分方便, 父子进程间通信也较容易。 但缺陷是, 每次创建映射区一定要依赖一个文件才能实现。通常为了建立映射区要 open 一个 temp 文件,创建好了再 unlink、 close掉,比较麻烦。 可以直接使用匿名映射来代替。 其实 Linux 系统给我们提供了创建匿名映射区的方法, 无需依赖一个文件即可创建映射区。 同样需要借助标志位参数 flags 来指定。

使用 MAP_ANONYMOUS (或 MAP_ANON), 如:

int *p = (int*)mmap(NULL, 4, PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANONYMOUS, -1, 0);
// 参数2中,"4"为随意举例,该位置表大小,可依实际需要填写。

例子:frok_map_anon_linux.cpp

需注意的是, MAP_ANONYMOUS 和 MAP_ANON 这两个宏是 Linux操作系统特有的宏。在某些类 Unix 系统中如无该宏定义,可使用如下两步来完成匿名映射区的建立。

fd = open("/dev/zero", O_RDWR);
p  = mmap(NULL, size, PROT_READ|PROT_WRITE, MMAP_SHARED, fd, 0);

// mmap参数2:size表示该位置表大小,可依实际需要填写。

例子:frok_map_anon.cpp

本地socket套接字

例子:UNIX域套接字用于进程间通信

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值