[网络通信协议]进程间的通信

最新推荐文章于 2024-03-17 18:04:03 发布

萌大大的瓶子

最新推荐文章于 2024-03-17 18:04:03 发布

阅读量657

点赞数

分类专栏：网络通信协议

本文链接：https://blog.csdn.net/teresa_cm/article/details/103971864

版权

网络通信协议专栏收录该内容

9 篇文章 0 订阅

订阅专栏

进程通信

进程特点

每个进程各自有不同的用户地址空间
任何一个进程的全局变量在另一个进程中都看不到
进程间交换数据必须通过内核

IPC机制

进程间通信（InterProcess Communication，IPC）是进程间共享消息的通信方式
消息是发送进程形成的消息块，将消息内容传送给接收进程
IPC机制是消息从一个进程的地址空间拷贝到另一个进程的地址空间

进程间的通信本质

进程之间可以看到一份公共资源；
提供这份资源的形式或者提供者不同，造成了通信方式不同

进程通信的目的

数据传输
一个进程需要将其数据发送给另一进程，发送的数据量在一个字节到几兆字节之间。
共享数据
多个进程想要操作共享数据，一个进程对共享数据的修改，别的进程应该立刻看到。
事件通知
一个进程需要向另一个或一组进程发送消息，通知它（它们）发生了某种事件（如进程终止时要通知父进程）。
资源共享
多个进程之间共享同样的资源。为了作到这一点，需要内核提供锁和同步机制。
进程控制
有些进程希望完全控制另一个进程的执行（如Debug进程），此时控制进程希望能够拦截另一个进程的所有陷入和异常，并能够及时知道它的状态改变。

管道

管道是一种古老的IPC通信形式。

特点

单工通信

不能同时在两个方向上传输数据。有的系统可能支持全双工。
具有固定的读端和写端。

只允许具有血缘关系的进程间通信。

经典的形式就是管道由父进程创建，进程fork子进程之后，就可以在父子进程之间使用了。

管道内部保证同步机制，从而保证访问数据的一致性。
面向字节流
管道随进程，进程在管道在，进程消失管道对应的端口也关闭，两个进程都消失管道也消失
特殊的文件

对于它的读写也可以使用普通的read、write 等函数。但是它不是普通的文件，并不属于其他任何文件系统，并且只存在于内存中

实现进程间的通信步骤

（1）父进程创建管道，得到两个文件描述符指向管道的两端
（2）父进程fork出子进程，子进程也有两个文件描述符指向同一管道。
（3）父进程关闭fd[0],子进程关闭fd[1]，即父进程关闭管道读端,子进程关闭管道写端（因为管道只支持单向通信）。父进程可以往管道写,子进程可以从管道读,管道是环形队列实现的,数据从写端流入从读端流出,这样就实现了进程间通信。

管道读取数据的四种的情况

（1）读端不读，写端一直写
（2）写端不写，但是读端一直读
（3）读端一直读，且fd[0]保持打开，而写端写了一部分数据不写了，并且关闭fd[1]。
如果一个管道读端一直在读数据，而管道写端的引⽤计数⼤于0决定管道是否会堵塞，引用计数大于0，只读不写会导致管道堵塞。
（4）读端读了一部分数据，不读了且关闭fd[0]，写端一直在写且f[1]还保持打开状态。

如果一个管道的写端一直在写，而读端的引⽤计数是否⼤于0决定管道是否会堵塞，引用计数大于0，只写不读再次调用write会导致管道堵塞；如果一个管道的读端一直在读，而写端的引⽤计数是否⼤于0决定管道是否会堵塞，引用计数大于0，只读不写再次调用read会导致管道堵塞；而当他们的引用计数等于0时，只写不读会导致写端的进程收到一个SIGPIPE信号，导致进程终止，只写不读会导致read返回0,就像读到文件末尾一样。

容量大小

测试管道容量大小只需要将写端一直写，读端不读且不关闭fd[0],即可。

管道的建立

当一个管道建立时，它会创建两个文件描述符：fd[0]为读而打开，fd[1]为写而打开。
要关闭管道只需将这两个文件描述符关闭即可。

创建

管道利用fork机制建立，从而让两个进程可以连接到同一个PIPE上。
最开始的时候，上面的两个箭头都连接在同一个进程Process 1上(连接在Process 1上的两个箭头)。当fork复制进程的时候，会将这两个连接也复制到新的进程(Process 2)。随后，每个进程关闭自己不需要的一个连接 (两个黑色的箭头被关闭; Process 1关闭从PIPE来的输入连接，Process 2关闭输出到PIPE的连接)，这样，剩下的红色连接就构成了如上图的PIPE。
在这里插入图片描述
• 管道通信的实现细节
在 Linux 中，管道的实现并没有使用专门的数据结构，而是借助了文件系统的file结构和VFS的索引节点inode。通过将两个 file 结构指向同一个临时的 VFS 索引节点，而这个 VFS 索引节点又指向一个物理页面而实现的。如下图
在这里插入图片描述
有两个 file 数据结构，但它们定义文件操作例程地址是不同的，其中一个是向管道中写入数据的例程地址，而另一个是从管道中读出数据的例程地址。这样，用户程序的系统调用仍然是通常的文件操作，而内核却利用这种抽象机制实现了管道这一特殊操作。

管道的读写

管道实现的源代码在fs/pipe.c中，在pipe.c中有很多函数，其中有两个函数比较重要，即管道读函数pipe_read()和管道写函数pipe_wrtie()。管道写函数通过将字节复制到 VFS 索引节点指向的物理内存而写入数据，而管道读函数则通过复制物理内存中的字节而读出数据。当然，内核必须利用一定的机制同步对管道的访问，为此，内核使用了锁、等待队列和信号。
当写进程向管道中写入时，它利用标准的库函数write()，系统根据库函数传递的文件描述符，可找到该文件的 file 结构。file 结构中指定了用来进行写操作的函数（即写入函数）地址，于是，内核调用该函数完成写操作。写入函数在向内存中写入数据之前，必须首先检查 VFS 索引节点中的信息，同时满足如下条件时，才能进行实际的内存复制工作：
• 内存中有足够的空间可容纳所有要写入的数据；
• 内存没有被读程序锁定。
如果同时满足上述条件，写入函数首先锁定内存，然后从写进程的地址空间中复制数据到内存。否则，写入进程就休眠在 VFS 索引节点的等待队列中，接下来，内核将调用调度程序，而调度程序会选择其他进程运行。写入进程实际处于可中断的等待状态，当内存中有足够的空间可以容纳写入数据，或内存被解锁时，读取进程会唤醒写入进程，这时，写入进程将接收到信号。当数据写入内存之后，内存被解锁，而所有休眠在索引节点的读取进程会被唤醒。
管道的读取过程和写入过程类似。但是，进程可以在没有数据或内存被锁定时立即返回错误信息，而不是阻塞该进程，这依赖于文件或管道的打开模式。反之，进程可以休眠在索引节点的等待队列中等待写入进程写入数据。当所有的进程完成了管道操作之后，管道的索引节点被丢弃，而共享数据页也被释放。

FIFO

命名管道，是一种文件类型

作用

无需创建中间临时文件，复制输出流
多客户-服务进程应用中，通过FIFO作为汇聚点，传输客户进程和服务进程之间的数据

特点

在无关进程间交换数据
是一种特殊设备文件形式，与路径名相关联
在数据读出时，FIFO管道中同时清除数据，并且“先进先出”。

设置非阻塞标志的区别

当 open 一个FIFO时，是否设置非阻塞标志（O_NONBLOCK）的区别：
若没有指定O_NONBLOCK（默认），只读 open 要阻塞到某个其他进程为写而打开此 FIFO。类似的，只写 open 要阻塞到某个其他进程为读而打开它。
若指定了O_NONBLOCK，则只读 open 立即返回。而只写 open 将出错返回 -1 如果没有进程已经为读而打开该 FIFO，其errno置ENXIO。

实现原理

FIFO (First in, First out)为一种特殊的文件类型，它在文件系统中有对应的路径。当一个进程以读®的方式打开该文件，而另一个进程以写(w)的方式打开该文件，那么内核就会在这两个进程之间建立管道，所以FIFO实际上也由内核管理，不与硬盘打交道。之所以叫FIFO，是因为管道本质上是一个先进先出的队列数据结构，最早放入的数据被最先读出来，从而保证信息交流的顺序。FIFO只是借用了文件系统(file system,命名管道是一种特殊类型的文件，因为Linux中所有事物都是文件，它在文件系统中以文件名的形式存在。)来为管道命名。写模式的进程向FIFO文件中写入，而读模式的进程从FIFO文件中读出。当删除FIFO文件时，管道连接也随之消失。FIFO的好处在于我们可以通过文件的路径来识别管道，从而让没有亲缘关系的进程之间建立连接

消息队列

存储在内核中的消息链表，元素是数据报，进程通过句柄访问
进程写入数据后退出，数据仍可用
由标识符（队列ID）标识

特点

面向记录

消息具有特定格式以及特定的优先级

独立于进程

进程终止时消息队列和内容不会被删除

消息随机查询

消息读取可以按照先进先出，也可以按照类型

可视为全局的链表，链表节点存放这数报的类型和内容，有消息队列和标识符进行标记
- 允许一个或者多个进程写入或者读取消息
生命周期随内核
双向通信

msgget创建新消息队列的条件

如果没有与键值key相对应的消息队列，并且flag中包含了IPC_CREAT标志位。
key参数为IPC_PRIVATE。
函数msgrcv在读取消息队列时，type参数有下面几种情况：
type == 0，返回队列中的第一个消息；
type > 0，返回队列中消息类型为 type 的第一个消息；
type < 0，返回队列中消息类型值小于或等于 type 绝对值的消息，如果有多个，则取类型值最小的消息。
可以看出，type值非 0 时用于以非先进先出次序读消息。也可以把 type 看做优先级的权值。

缺点

消息上限：MSGMAX
队列总字节数上限：MSGMNB
系统消息队列总数上限：MSGMNI

信号量

在内核中创建一个信号量集合（本质是个数组），数组的元素（信号量）都是1，使用P操作进行-1，使用V操作+1，

信号量(semophore)是一个计数器，锁机制
信号量是一个特殊的变量，程序对其访问都是原子操作，且只允许对它进行等待（即P(信号变量))和发送（即V(信号变量))信息操作。

作用

进程间的互斥与同步
多个进程需要对共享数据进行访问的时候。
克服不能同时有两个进程对同一数据进行访问的问题。

主要流程

• 检查控制该资源的信号量
• 如果信号量值大于0，则资源可用，并且将其减1，表示当前已被使用
• 如果信号量值为0，则进程休眠直至信号量值大于0

特点

信号量用于进程间同步，若要在进程间传递数据需要结合共享内存。
信号量基于操作系统的 PV 操作，程序对信号量的操作都是原子操作。
每次对信号量的 PV 操作不仅限于对信号量值加 1 或减 1，而且可以加减任意正整数。
支持信号量组。

分类

二值信号量（Binary Semaphore）：变量只有0和1
通用信号量：可以取多个正整数
Linux 下的信号量函数都是在通用的信号量数组上进行操作，而不是在一个单一的二值信号量上进行操作。

工作原理

由于信号量只能进行两种操作等待和发送信号，即P(sv)和V(sv),他们的行为是这样的：
• P(sv)：如果sv的值大于零，就给它减1；如果它的值为零，就挂起该进程的执行
• V(sv)：如果有其他进程因等待sv而被挂起，就让它恢复运行，如果没有进程因等待sv而挂起，就给它加1.
举个例子，就是两个进程共享信号量sv，一旦其中一个进程执行了P(sv)操作，它将得到信号量，并可以进入临界区，使sv减1。而第二个进程将被阻止进入临界区，因为当它试图执行P(sv)时，sv为0，它会被挂起以等待第一个进程离开临界区域并执行V(sv)释放信号量，这时第二个进程就可以恢复执行。
（1） P(sv)：如果sv的值⼤大于零，就给它减1；如果它的值为零，就挂起该进程的执⾏。
（2） V(sv)：如果有其他进程因等待sv而被挂起，就让它恢复运⾏，如果没有进程因等待sv⽽挂起，就给它加1。

PV操作用于同一进程，实现互斥。
PV操作用于不同进程，实现同步。

semget函数

它的作用是创建一个新信号量或取得一个已有信号量，原型为：
int semget(key_t key, int num_sems, int sem_flags);
• 第一个参数key是整数值（唯一非零），不相关的进程可以通过它访问一个信号量，它代表程序可能要使用的某个资源，程序对所有信号量的访问都是间接的，程序先通过调用semget函数并提供一个键，再由系统生成一个相应的信号标识符（semget函数的返回值），只有semget函数才直接使用信号量键，所有其他的信号量函数使用由semget函数返回的信号量标识符。如果多个程序使用相同的key值，key将负责协调工作。
• 第二个参数num_sems指定需要的信号量数目，它的值几乎总是1。
• 第三个参数sem_flags是一组标志，当想要当信号量不存在时创建一个新的信号量，可以和值IPC_CREAT做按位或操作。设置了IPC_CREAT标志后，即使给出的键是一个已有信号量的键，也不会产生错误。而IPC_CREAT | IPC_EXCL则可以创建一个新的，唯一的信号量，如果信号量已存在，返回一个错误。
semget函数成功返回一个相应信号标识符（非零），失败返回-1.

semop函数

它的作用是改变信号量的值，原型为：
int semop(int sem_id, struct sembuf *sem_opa, size_t num_sem_ops);
sem_id是由semget返回的信号量标识符，sembuf结构的定义如下：
struct sembuf{
short sem_num;//除非使用一组信号量，否则它为0
short sem_op;//信号量在一次操作中需要改变的数据，通常是两个数，一个是-1，即P（等待）操作，
//一个是+1，即V（发送信号）操作。
short sem_flg;//通常为SEM_UNDO,使操作系统跟踪信号，
//并在进程没有释放该信号量而终止时，操作系统释放信号量
};

semctl函数

int semctl(int sem_id, int sem_num, int command, …);
如果有第四个参数，它通常是一个union semum结构，定义如下：
union semun{
int val;
struct semid_ds *buf;
unsigned short *arry;
};
前两个参数与前面一个函数中的一样，command通常是下面两个值中的其中一个
SETVAL：用来把信号量初始化为一个已知的值。p 这个值通过union semun中的val成员设置，其作用是在信号量第一次使用前对它进行设置。
IPC_RMID：用于删除一个已经无需继续使用的信号量标识符。

参数解释

Sem_op

一次操作中的信号量的改变量
.>0
进程释放响应的资源数
<0
请求绝对资源
如果相应的资源数可以满足请求，则将该信号量的值减去sem_op的绝对值，函数成功返回。
当相应的资源数不能满足请求时，这个操作与sem_flg有关。

Sem_flg

sem_flg 指定IPC_NOWAIT，则semop函数出错返回EAGAIN。
sem_flg 没有指定IPC_NOWAIT，则将该信号量的semncnt值加1，然后进程挂起直到下述情况发生：

当相应的资源数可以满足请求，此信号量的semncnt值减1，该信号量的值减去sem_op的绝对值。成功返回；
此信号量被删除，函数smeop出错返回EIDRM；
进程捕捉到信号，并从信号处理函数返回，此情况下将此信号量的semncnt值减1，函数semop出错返回EINTR
若sem_op == 0，进程阻塞直到信号量的相应值为0：
当信号量已经为0，函数立即返回。
如果信号量的值不为0，则依据sem_flg决定函数动作：

Semctl

SETVAL：用于初始化信号量为一个已知的值。所需要的值作为联合semun的val成员来传递。在信号量第一次使用之前需要设置信号量。
IPC_RMID：删除一个信号量集合。如果不删除信号量，它将继续在系统中存在，即使程序已经退出，它可能在你下次运行此程序时引发问题，而且信号量是一种有限的资源。

共享内存

映射一段能被其他进程访问的内存
由一个进程创建多个进程可以访问

特点

访问速度最快

不用从用户态到内核态的频繁切换和拷贝数据，直接从内存中读取

需要额外的访问控制机制

是临界资源，操作时必须保证其原子性
可以多个进程同时操作

生命周期随内核

UNIX域套接字

特点

不需要执行协议，仅仅复制数据
比网络套接字速度快
适用于同一台计算机上的进程通信

网络套接字（Socket）

可用于不同机器间的进程通信

信号(singnal)

进程间和线程间的同步手段
通知接收进程某个事件已经发生

各通信方式的比较和优缺点

管道：速度慢，容量有限，只有父子进程能通讯
FIFO：任何进程间都能通讯，但速度慢
消息队列：容量受到系统限制，且要注意第一次读的时候，要考虑上一次没有读完数据的问题，消息队列可以不再局限于父子进程，而允许任意进程通过共享消息队列来实现进程间通信，并由系统调用函数来实现消息发送和接收之间的同步，从而使得用户在使用消息缓冲进行通信时不再需要考虑同步问题，使用方便，但是信息的复制需要额外消耗CPU的时间，不适宜于信息量大或操作频繁的场合。此种方法不太常用
信号量：不能用来传递复杂消息，只能用来同步
共享内存：利用内存缓冲区直接交换信息，无须复制，快捷、信息量大是其优点。共享内存块提供了在任意数量的进程之间进行高效双向通信的机制。每个使用者都可以读取写入数据，但是所有程序之间必须达成并遵守一定的协议，以防止诸如在读取信息之前覆写内存空间等竞争状态的出现。

进程间通信方式的选择

• PIPE和FIFO(有名管道)用来实现进程间相互发送非常短小的、频率很高的消息，这两种方式通常适用于两个进程间的通信
• 共享内存用来实现进程间共享的、非常庞大的、读写操作频率很高的数据；这种方法适用于多进程间的通信
• 其他考虑用socket。主要应用在分布式开发中

几种通讯方式总结

1.管道：速度慢，容量有限，只有父子进程能通讯
2.FIFO：任何进程间都能通讯，但速度慢
3.消息队列：容量受到系统限制，且要注意第一次读的时候，要考虑上一次没有读完数据的问题
4.信号量：不能传递复杂消息，只能用来同步
5.共享内存区：能够很容易控制容量，速度快，但要保持同步，比如一个进程在写的时候，另一个进程要注意读写的问题，相当于线程中的线程安全，当然，共享内存区同样可以用作线程间通讯，不过没这个必要，线程间本来就已经共享了同一进程内的一块内存
所有的以上的方式都是生命周期随内核，不手动释就不会消失。

萌大大的瓶子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[网络通信协议]进程间的通信

进程通信进程特点每个进程各自有不同的用户地址空间任何一个进程的全局变量在另一个进程中都看不到进程间交换数据必须通过内核IPC机制进程间通信（InterProcess Communication，IPC）是进程间共享消息的通信方式消息是发送进程形成的消息块，将消息内容传送给接收进程IPC机制是消息从一个进程的地址空间拷贝到另一个进程的地址空间进程间的通信本质进程之间可以看到一...
复制链接

扫一扫