管道基础
管道是一种最基本的IPC机制,作用于有血缘关系的进程之间(多用于父子进程间的通信),完成数据传递。调用pipe系统函数即可创建一个管道。有如下特质:
1. 是一个伪文件(本质为内核缓冲区)
2. 由两个文件描述符引用,一个表示读端,一个表示写端。
3. 规定数据从管道的写端流入管道,从读端流出。
管道的原理: 管道实为内核借助内核缓冲区(4k)实现的环形队列。
管道的局限性:
① 数据自己读不能自己写。
② 数据一旦被读走,便不在管道中存在,不可反复读取。
③ 由于管道采用半双工通信方式。因此,数据只能在一个方向上流动(要想实现双工就只能建立两个管道)。
④ 只能在有公共祖先的进程间使用管道。
常见的通信模式有,单工通信、半双工通信、全双工通信。
- 单工通信:是指消息只能单方向传输的工作方式。例如遥控、遥测(一部分),就是单工通信方式。
- 半双工通信:是指数据可以沿两个方向传送,但同一时刻一个信道只允许单方向传送。例如:无线对讲机就是一种半双工设 备,在同一时间内只允许一方讲话。
- 全双工:是指在通信的任意时刻,线路上可以同时存在A到B和B到A的双向信号传输。电话就是典型的全双工
如何用管道实现进程间通讯
int pipe(int pipefd[2]); 成功:0;失败:-1,设置errno
desc : 函数调用成功返回r/w两个文件描述符。无需open,但需手动close。规定:fd[0] → r; fd[1] → w,就像0对应标准输入,1对应标准输出一样。向管道文件读写数据其实是在读写内核缓冲区。
管道创建成功以后,创建该管道的进程(父进程)同时掌握着管道的读端和写端。如何实现父子进程间通信呢?通常可以采用如下步骤:
1. 父进程调用pipe函数创建管道,得到两个文件描述符fd[0]、fd[1]指向管道的读端和写端。
2. 父进程调用fork创建子进程,那么子进程也有两个文件描述符指向同一管道。
3. 父进程关闭管道读端,子进程关闭管道写端。父进程可以向管道中写入数据,子进程将管道中的数据读出。由于管道是利用环形队列实现的,数据从写端流入管道,从读端流出,这样就实现了进程间通信。
由上我们可以知道, 管道实现进程间通信经历两次内存拷贝, 1:写端内存copy到管道。2:管道copy到读端内存
demo:
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<unistd.h>
int main()
{
int fds[2], childPid, parentPid;
int rst = 0, count;
char buffer[1024];
rst = pipe(fds);
if (rst == -1) {
perror("pipe error:");
return -1;
}
rst = fork();
if (rst == -1) {
perror("fork failed: ");
return -1;
}
else if (rst == 0) {
printf("This is parent:will read\n");
close(fds[1]);
while (1) {
memset(buffer, 0, 1024);
count = read(fds[0], buffer, 1024);
printf("\ncount == %d\n", count);
write(STDOUT_FILENO, buffer, count);
}
}else {
printf("This is child: will write\n");
childPid = rst;
close(fds[0]);
while (1) {
memset(buffer, 0, 1024);
memcpy(buffer, "abc123abc", 9);
count = write(fds[1], buffer, 1024);
sleep(5);
}
}
return 0;
}
result :
NOTE: 大家对pipe的理解一定要充分, pipe能够实现进程间通信的理论基础是:fork之后父子进程共享打开的文件描述符(未见描述符是有内核空间的内存背书)。函数pipe()传出一对文件描述符, 分别指向读端和写端。这其实就是pipe的全部, 至于developer怎么利用这一点, 爱咋咋地。并不是说一定要父子进程分别关闭读端和写端, 也不是说就只能向一边发数据(只不过是同一时间点不能够双向发, 只要时序安排得当, 照样没问题, 但是问题的关键是在现实中根本没法安排时序, 下例中给出了双向发消息), 我们知识为了实现正确的进程间通信, 来给开发者添加一些潜规则, 避免不必要的麻烦和错误。
总结:
1. 父子进程都不做任何关闭=====>>>>没问题
2. 人为控制时序的双向发消息=====>>>>没问题
3. 自己写自己读=====>>>>没问题(除非闲的蛋疼了)
4. 一个进程写, 其他的亲戚读取============>>>>没问题(要是你能够控制好同步问题, 但是不要忘了,读完可就没了)
所以管道的单向通信只是我们选取了管道的诸多使用办法中靠谱有用的一种而已, 好比黄瓜可以煎炒烹炸,我们却只用它调凉菜, 因为别的做法不好吃。至于放不放葱花(是否做相应的关闭操作), 放那个牌子的生抽(谁读谁写), 放几种调料(几个读,几个写), 全凭自己爱好。
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<unistd.h>
int main()
{
int fds[2], childPid, parentPid;
int rst = 0, count;
char buffer[1024];
rst = pipe(fds);
if (rst == -1) {
perror("pipe error:");
return -1;
}
rst = fork();
if (rst == -1) {
perror("fork failed: ");
return -1;
}
else if (rst == 0) {
printf("parent = %d\n", getpid());
sleep(1);
while (1) {
memset(buffer, 0, 1024);
count = read(fds[0], buffer, 1024);
printf("%s, %d\n", buffer, getpid());
sleep(3);
memcpy(buffer, "123456789", 9);
count = write(fds[1], buffer, 1024);
sleep(3);
}
}else {
printf("child = %d\n", getpid());
while (1) {
memset(buffer, 0, 1024);
memcpy(buffer, "abcdefghi", 9);
count = write(fds[1], buffer, 1024);
sleep(3);
count = read(fds[0], buffer, 1024);
printf("%s, %d\n", buffer, getpid());
sleep(3);
}
}
return 0;
}
管道读写行为
使用管道需要注意以下4种特殊情况(假设都是阻塞I/O操作,没有设置O_NONBLOCK标志):
- 1. 如果所有指向管道写端的文件描述符都关闭了(管道写端引用计数为0),而仍然有进程从管道的读端读数据,那么管道中剩余的数据都被读取后,再次read会返回0,就像读到文件末尾一样。
- 2. 如果有指向管道写端的文件描述符没关闭(管道写端引用计数大于0),而持有管道写端的进程也没有向管道中写数据,这时有进程从管道读端读数据,那么管道中剩余的数据都被读取后,再次read会阻塞,直到管道中有数据可读了才读取数据并返回。
- 3. 如果所有指向管道读端的文件描述符都关闭了(管道读端引用计数为0),这时有进程向管道的写端write,那么该进程会收到信号SIGPIPE,通常会导致进程异常终止。当然也可以对SIGPIPE信号实施捕捉,不终止进程。具体方法信号章节详细介绍。
- 4. 如果有指向管道读端的文件描述符没关闭(管道读端引用计数大于0),而持有管道读端的进程也没有从管道中读数据,这时有进程向管道写端写数据,那么在管道被写满时再次write会阻塞,直到管道中有空位置了才写入数据并返回。
总结:
① 读管道:
1. 管道中有数据,read返回实际读到的字节数。
2. 管道中无数据:
(1) 管道写端被全部关闭,read返回0 (好像读到文件结尾)
(2) 写端没有全部被关闭,read阻塞等待(不久的将来可能有数据递达,此时会让出cpu)
② 写管道:
1. 管道读端全部被关闭,进程异常终止(也可使用捕捉SIGPIPE信号,使进程不终止)
2. 管道读端没有全部关闭:
(1) 管道已满,write阻塞。
(2) 管道未满,write将数据写入,并返回实际写入的字节数。
混淆的东西,管道的容量和管道的缓冲区大小。
管道的容量:指管道满时装的字节数,自2.6.11内核后,容量为64k(65536)。管道满了就会导致写操作产生阻塞。
管道缓冲区大小:由PIPE_BUF指定,指的是保证管道写操作为原子操作的最大值,如果一次写入的内容超过这个值,那么这次的写操作就不是原子的。什么意思呢?就是指,可能存在多个进程写同一个管道,如果一次写入的字节数大于缓冲区大小,则可能会出现A进程写入的内容中插入了B进程写入的内容。通常可以
下面是manpage的解释, 大家可以 man 7 pipe看
Pipe capacity
A pipe has a limited capacity. If the pipe is full, then a write(2) will block or fail, depending on whether the O_NONBLOCK flag is set (see
below). Different implementations have different limits for the pipe capacity. Applications should not rely on a particular capacity: an
application should be designed so that a reading process consumes data as soon as it is available, so that a writing process does not remain
blocked.
In Linux versions before 2.6.11, the capacity of a pipe was the same as the system page size (e.g., 4096 bytes on i386). Since Linux 2.6.11,
the pipe capacity is 16 pages (i.e., 65,536 bytes in a system with a page size of 4096 bytes). Since Linux 2.6.35, the default pipe capacity
is 16 pages, but the capacity can be queried and set using the fcntl(2) F_GETPIPE_SZ and F_SETPIPE_SZ operations. See fcntl(2) for more
information.
#include <sys/types.h>
#include <sys/stat.h>
#include <stdio.h>
#include <fcntl.h>
#include <signal.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#define MAXLINE 4096+100
int main(void)
{
int n;
int fd[2];
pid_t pid;
char line[MAXLINE];
if (pipe(fd) < 0)
{
perror("pipe error");
}
if ((pid = fork()) < 0)
{
perror("fork error");
}
else if (pid > 0) /* parent */
{
close(fd[1]);
while ( 1 )
{
n = read(fd[0], line, MAXLINE);
write(STDOUT_FILENO, line, n);
write(STDOUT_FILENO, "\n\n\n", 3);
}
}
else /* child */
{
if ((pid = fork()) < 0)
{
perror("fork error");
}
else if (pid > 0)
{
close(fd[0]);
while (1)
{
memset(line, 'a',MAXLINE);
write(fd[1], line, MAXLINE);
}
}
else
{
close(fd[0]);
while ( 1 )
{
memset(line, 'b',MAXLINE);
write(fd[1], line, MAXLINE);
}
}
}
exit(0);
}
在 Linux 中,管道的实现并没有使用专门的数据结构,而是借助了文件系统的file结构和VFS的索引节点inode。通过将两个 file 结构指向同一个临时的 VFS 索引节点,而这个 VFS 索引节点又指向一个物理页面而实现的。
有两个 file 数据结构,但它们定义文件操作例程地址是不同的,其中一个是向管道中写入数据的例程地址,而另一个是从管道中读出数据的例程地址。这样,用户程序的系统调用仍然是通常的文件操作,而内核却利用这种抽象机制实现了管道这一特殊操作。
//inode结点信息结构
struct inode {
...
struct pipe_inode_info *i_pipe;
...
};
//管道缓冲区个数
#define PIPE_BUFFERS (16)
//管道缓存区对象结构
struct pipe_buffer {
struct page *page; //管道缓冲区页框的描述符地址
unsigned int offset, len; //页框内有效数据的当前位置,和有效数据的长度
struct pipe_buf_operations *ops; //管道缓存区方法表的地址
};
//管道信息结构
struct pipe_inode_info {
wait_queue_head_t wait; //管道等待队列
unsigned int nrbufs, curbuf;
//包含待读数据的缓冲区数和包含待读数据的第一个缓冲区的索引
struct pipe_buffer bufs[PIPE_BUFFERS]; //管道缓冲区描述符数组
struct page *tmp_page; //高速缓存区页框指针
unsigned int start; //当前管道缓存区读的位置
unsigned int readers; //读进程的标志,或编号
unsigned int writers; //写进程的标志,或编号
unsigned int waiting_writers; //在等待队列中睡眠的写进程的个数
unsigned int r_counter; //与readers类似,但当等待读入FIFO的进程是使用
unsigned int w_counter; //与writers类似,但当等待写入FIFO的进程时使用
struct fasync_struct *fasync_readers; //用于通过信号进行的异步I/O通知
struct fasync_struct *fasync_writers; //用于通过信号的异步I/O通知
大家可以通过阅读/usr/src/kernels/4.18.0-147.5.1.el8_1.x86_64/include/linux/pipe_fs_i.h 来获取更多关于pipe的实现细节