管道定义
管道是进程间通信的主要手段之一。一个管道实际上就是个只存在于内存中的文件,对这个文件的操作要通过两个已经打开的文件进行,它们分别代表管道的两端。管道是一种特殊的文件,它不属于某一种文件系统,而是一种独立的文件系统,有其自己的数据结构。根据管道的适用范围将其分为:无名管道和命名管道。
管道通信的实现机制
实现机制:
管道是由内核管理的一个缓冲区,相当于我们放入内存中的一个纸条。管道的一端连接一个进程的输出。这个进程会向管道中放入信息。管道的另一端连接一个进程的输入,这个进程取出被放入管道的信息。一个缓冲区不需要很大一般为4K大小,它被设计成为环形的数据结构,以便管道可以被循环利用。当管道中没有信息的话,从管道中读取的进程会等待,直到另一端的进程放入信息。当管道被放满信息的时候,尝试放入信息的进程会等待,直到另一端的进程取出信息。当两个进程都终结的时候,管道也自动消失。
从原理上,管道利用fork机制建立,从而让两个进程可以连接到同一个PIPE上。最开始的时候,上面的两个箭头都连接在同一个进程Process 1上(连接在Process 1上的两个箭头)。当fork复制进程的时候,会将这两个连接也复制到新的进程(Process 2)。随后,每个进程关闭自己不需要的一个连接 (两个黑色的箭头被关闭; Process 1关闭从PIPE来的输入连接,Process 2关闭输出到PIPE的连接),这样,剩下的红色连接就构成了如上图的PIPE。
详细的管道创建过程如下图:
实现细节:
在 Linux 中,管道的实现并没有使用专门的数据结构,而是借助了文件系统的file结构和VFS的索引节点inode。通过将两个 file 结构指向同一个临时的 VFS 索引节点,而这个 VFS 索引节点又指向一个物理页面而实现的。如下图
有两个 file 数据结构,但它们定义文件操作例程地址是不同的,其中一个是向管道中写入数据的例程地址,而另一个是从管道中读出数据的例程地址。这样,用户程序的系统调用仍然是通常的文件操作,而内核却利用这种抽象机制实现了管道这一特殊操作。
无名管道
主要用于父进程与子进程之间,或者两个兄弟进程之间。在linux系统中可以通过系统调用建立起一个单向的通信管道,且这种关系只能由父进程来建立。因此,每个管道都是单向的,当需要双向通信时就需要建立起两个管道。管道两端的进程均将该管道看做一个文件,一个进程负责往管道中写内容,而另一个从管道中读取。这种传输遵循“先入先出”(FIFO)的规则。
函数pipe
小程序
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
#include<string.h>
int main()
{
int fd[2] = {0};
int ret = pipe(fd);
if (-1 == ret)
{
perror("pipe");
exit(1);
}
pid_t pid = fork();
if (-1 == pid)
{
perror("pipe");
exit(2);
}
if (0 == pid)
{
// c : read
char buffer[32] = {0};
while (1)
{
if (-1 == read(fd[0], buffer, 32))
{
perror("read");
exit(3);
}
printf("c recv : %s\n", buffer);
if (strcmp("exit", buffer) == 0)
{
close(fd[0]);
exit(0);
}
if (-1 == write(fd[1], buffer, strlen(buffer)))
{
perror("write");
exit(4);
}
sleep(1);
memset(buffer, 0, 32);
}
}
else
{
// p : write
char buffer[32] = {0};
while (1)
{
scanf("%s", buffer);
if (-1 == write(fd[1], buffer, strlen(buffer)))
{
perror("write");
exit(4);
}
if (strcmp("exit", buffer) == 0)
{
close(fd[1]);
exit(0);
}
sleep(1);
if (-1 == read(fd[0], buffer, 32))
{
perror("read");
exit(3);
}
printf("p recv : %s\n", buffer);
memset(buffer, 0, 32);
}
}
}