【Linux0.11 内核源码剖析】进程间通信——管道（pipe）

最新推荐文章于 2023-06-20 15:13:19 发布

selfimpr1991

最新推荐文章于 2023-06-20 15:13:19 发布

阅读量2.4k

点赞数 5

分类专栏： Linux Kernel OpenSource 文章标签： Linux0.11 进程间通信 pipe 内核源码

本文链接：https://blog.csdn.net/wenqian1991/article/details/46316915

版权

OpenSource 同时被 2 个专栏收录

38 篇文章 11 订阅

订阅专栏

Linux Kernel

17 篇文章 17 订阅

订阅专栏

一、简介

所谓管道，是指用于连接一个读进程和一个写进程，以实现它们之间通信的共享文件，又称pipe文件。向管道（共享文件）提供输入的发送进程（即写进程），以字符流形式将大量的数据送入管道，而接收管道输出的接收进城（即读进程），可从管道中接收数据。由于发送进程和接收进程是利用管道进行通信的，故又称管道通信。这种方式能够传送大量数据，且很有效。

为了协调双方的通信，管道通信机制必须提供以下三方面的协调能力：

互斥。当一个进程正在对pipe进行读/写操作时，另一个进程必须等待
同步。当写（输入）进程把一定数量数据写入pipe后，便去睡眠等待，直到读（输出）进程取走数据后，再把它唤醒。当读进程读到一空pipe时，也应睡眠等待，直至写进程将数据写入管道后，才将它唤醒
对方是否存在。只有确定对方已存在时，才能进行通信

从本质上来说，管道也是一种文件（记得有人说过，Linux中，一切皆文件），为了克服上面的问题，管道通信机制限制了管道的大小，实际上管道是一个固定大小的缓冲区，在Linux中，该缓冲区的大小为4KB，恰好为一个页面大小。这使得它的大小收到限制，不像文件那样无限制的不加检验的增长。但同时也会导致当管道已满，而写通道仍有数据待输入，此时，管道的输入端write()调用则必须被阻塞（向管道的写入和读取，使用的是标准的库函数write() 和 read()），直到管道的输出端有数据被读取，管道腾出了足够的空间供 write()调用，才被唤醒写入。同样当读取进程工作的比写入进程快时，会存在管道中所有数据已被读取，此时，管道为空，则管道的输出端read()也将被阻塞，直到管道中数据被唤醒。

从管道读数据是一次性操作，数据一旦被读，它就从管道中被抛弃，释放空间一遍写更多的数据。事实上，C/C++编程时，从首位置开始逐步读取字符串中的数据，前面的字符会随之被抛弃。

二、管道的结构

在Linux 中，管道的实现并没有使用专门的数据结构，而是借助了文件系统中file 结构和 VFS的索引节点 inode。通过将两个 file 结构指向同一个临时的 VFS 索引节点inode，这个索引节点又指向同一个物理页面来实现的。如下图所示，相信可以看出管道的内部实现机制了：进程1 将自己的进程地址空间中的数据先复制到inode 指定的物理页面上，然后进程2 则复制 inode 指定的页面（同一个页面，即共享的数据页）上的数据到自己的进程地址空间上。这就完成了进程1的写，进程2的读，反之一样。换句话说共享了一个物理页。

三、源码解读内部实现（Linux 0.11）

管道实现的源码在fs/pipe.c 中，pipe.c 中只有三个函数，write_pipe()、read_pipe() 和 sys_pipe()。下面分别看看这三个函数：

3.1、创建管道——sys_pipe

把管道看做一个循环队列，清楚管道的结构和机制，这对理解管道的读写操作非常重要！

 创建管道系统调用函数。
// 在fildes 所指的数组中创建一对文件句柄(描述符)。这对文件句柄指向一管道i 节点。fildes[0]
// 用于读管道中数据，fildes[1]用于向管道中写入数据。
// 成功时返回0，出错时返回-1。
int sys_pipe(unsigned long * fildes)
{
	struct m_inode * inode;
	struct file * f[2];
	int fd[2];
	int i, j;

	/*为管道文件在文件管理表中射你请空闲项*/
	// 从内核文件管理表中取两个空闲项（引用计数字段为0 的项），并分别设置引用计数为1。
	j = 0;
	for (i = 0; j<2 && i<NR_FILE; i++)
	if (!file_table[i].f_count)
		(f[j++] = i + file_table)->f_count++;
	// 如果只有一个空闲项，则释放该项(引用计数复位)。必须两个才有效
	if (j == 1)
		f[0]->f_count = 0;
	// 如果没有找到两个空闲项，则返回-1。
	if (j<2)
		return -1;

	/*为管道文件与进程建立联系创造条件。一旦父进程fork子进程，子进程将会拷贝这一切，同样与管道文件表项建立了联系*/
	// 针对上面取得的两个文件结构项，分别分配一文件句柄，并使进程的文件结构指针分别指向这两个
	// 文件结构，一个写入端，一个输出端。
	j = 0;
	for (i = 0; j<2 && i<NR_OPEN; i++)
	if (!current->filp[i]) {
		current->filp[fd[j] = i] = f[j];
		j++;
	}
	// 如果只有一个空闲文件句柄，则释放该句柄。
	if (j == 1)
		current->filp[fd[0]] = NULL;
	// 如果没有找到两个空闲句柄，则释放上面获取的两个文件结构项（复位引用计数值），并返回-1。
	if (j<2) {
		f[0]->f_count = f[1]->f_count = 0;
		return -1;
	}

	/*创建管道文件i 节点*/
	// 申请管道i 节点，并为管道分配缓冲区（1 页内存）。如果不成功，则相应释放两个文件句柄和文
	// 件结构项，并返回-1。
	if (!(inode = get_pipe_inode())) {//申请一个空闲内存页面，并将该页面的地址载入i节点
		current->filp[fd[0]] =
			current->filp[fd[1]] = NULL;
		f[0]->f_count = f[1]->f_count = 0;
		return -1;
	}

	/*将管道文件i 节点与文件管理表建立联系*/
	// 初始化两个文件结构，都指向同一个i 节点，读写指针都置零。第1 个文件结构的文件模式置为读，
	// 第2 个文件结构的文件模式置为写。
	f[0]->f_inode = f[1]->f_inode = inode;
	f[0]->f_pos = f[1]->f_pos = 0;
	f[0]->f_mode = 1;		/* read */
	f[1]->f_mode = 2;		/* write */

	// 将文件句柄数组复制到对应的用户数组中，并返回0，退出。
	put_fs_long(fd[0], 0 + fildes);
	put_fs_long(fd[1], 1 + fildes);
	return 0;
}

get_pipe_inode() 函数

 获取管道节点。返回为i 节点指针（如果是NULL 则失败）。
// 首先扫描i 节点表，寻找一个空闲i 节点项，然后取得一页空闲内存供管道使用。
// 然后将得到的i 节点的引用计数置为2(读者和写者)，初始化管道头和尾，置i 节点的管道类型表示。
struct m_inode * get_pipe_inode(void)
{
	struct m_inode * inode;

	if (!(inode = get_empty_inode()))	// 如果找不到空闲i 节点则返回NULL。
		return NULL;
	if (!(inode->i_size = get_free_page())) {// 节点的i_size 字段指向缓冲区。i_size表示内存页面的起始地址
		inode->i_count = 0;					// 如果已没有空闲内存，则
		return NULL;						// 释放该i 节点，并返回NULL。
	}
	inode->i_count = 2;	/* 读/写两者总计 */
	PIPE_HEAD(*inode) = PIPE_TAIL(*inode) = 0;// 复位管道头尾指针。
	inode->i_pipe = 1;			// 置节点为管道使用的标志。
	return inode;		// 返回i 节点指针。
}

从上面可以看出，管道的创建过程：1、为管道文件在文件管理表中申请空闲项；2、为管道文件与进程建立联系创造条件；3、创建管道文件i 节点；4、将管道文件i 节点与文件管理表建立联系；5、将管道文件句柄返回给用户进程。

// 管道头、管道尾、管道大小、管道空、管道满、管道头指针递增。
#define PIPE_HEAD(inode) ((inode).i_zone[0])
#define PIPE_TAIL(inode) ((inode).i_zone[1])
#define PIPE_SIZE(inode) ((PIPE_HEAD(inode)-PIPE_TAIL(inode))&(PAGE_SIZE-1))
#define PIPE_EMPTY(inode) (PIPE_HEAD(inode)==PIPE_TAIL(inode))
#define PIPE_FULL(inode) (PIPE_SIZE(inode)==(PAGE_SIZE-1))
/*
下面用C语言实现就是 #define INC_PIPE(head) (((*head)++)&(PAGE_SIZE-1))
用汇编实现，将数据放入寄存器中，速度更快
*/
#define INC_PIPE(head) _INC_PIPE(&(head))
extern _inline void _INC_PIPE(unsigned long *head) {
	_asm mov ebx, head  //head存入ebx中
	_asm inc dword ptr[ebx] //将ebx指向的数据加1
		_asm and dword ptr[ebx], 4095 //结果与4095
}

3.2、写管道——write_pipe

如果执行 write 函数（文件描述符为管道文件描述符），write函数会映射到系统调用函数 sys_write 中去执行，并最终执行到 write_pipe 函数中。

/*管道类似于一个循环队列*/
 管道写操作函数。
// 参数inode 是管道对应的i 节点，buf 是数据缓冲区指针，count 是将写入管道的字节数。
int write_pipe(struct m_inode * inode, char * buf, int count)
{
	int chars, size, written = 0;

	// 若将写入的字节计数值count 还大于0，则循环执行以下操作。
	while (count>0) {
		// 若当前管道中已经满了(size=0)，没有空间可以写入数据了，则唤醒等待该节点的进程(读管道)，
		//如果已没有读管道者，则向进程发送SIGPIPE 信号，并返回已写入的字节数并退出。
		// 若写入0 字节，则返回-1。否则在该i 节点上睡眠，等待管道腾出空间。

		while (!(size = (PAGE_SIZE - 1) - PIPE_SIZE(*inode))) {//可写入大小
			wake_up(&inode->i_wait);//唤醒读管道进程
			if (inode->i_count != 2) { /* 没有读进程 */
				current->signal |= (1 << (SIGPIPE - 1));
				return written ? written : -1;
			}
			sleep_on(&inode->i_wait);//挂起写管道进程
		}
		// 取管道头部到缓冲区末端空间字节数chars。如果其大于还需要写入的字节数count，则令其等于
		// count。如果chars 大于当前管道中空闲空间长度size，则令其等于size。
		/*管道可以看做一个循环队列，清楚chars 与 size的区别*/
		chars = PAGE_SIZE - PIPE_HEAD(*inode);//chars <= size
		if (chars > count)
			chars = count;
		if (chars > size)
			chars = size;
		// 写入字节计数减去此次可写入的字节数chars，并累加已写字节数到written。
		count -= chars;
		written += chars;
		// 令size 指向管道数据头部，调整当前管道数据头部指针（前移chars 字节）。
		/**/
		size = PIPE_HEAD(*inode);
		PIPE_HEAD(*inode) += chars;
		PIPE_HEAD(*inode) &= (PAGE_SIZE - 1);
		// 从用户缓冲区复制chars 个字节到管道中。对于管道i 节点，其i_size 字段中是管道缓冲块指针。
		while (chars-->0)//管道头部位置为读管道指针位置
			((char *)inode->i_size)[size++] = get_fs_byte(buf++);
	}
	// 唤醒等待该i 节点的进程（写管道），返回已写入的字节数，退出。
	wake_up(&inode->i_wait);
	return written;
}

把管道理解为一个循环队列，一个指针标明写入，一个指针标明读出。所以在判断管道满和空的情况下，是以循环队列的标准来判断，在写入的过程中，写管道指针一直指向数据的写入位置，一直向管道尾端移动，写满后，指针已经从管道的首段移动到尾端了，如下图所示。再次执行写管道操作时，系统会将写管道指针从管道尾端移动到管道首端，继续将数据写入管道。

Linux 0.11 默认：每次写管道执行完毕后，管道中就已经拥有了可以读出的数据，所以就会唤醒读管道进程；每次读管道操作完毕后，管道中就已经拥有了可以写入数据的空间，所以就会唤醒写管道进程。

如果管道中没有空间可以写入数据，此时系统将挂起写管道进程，然后切换到读管道进程去执行。但是需要注意的是，任何进程挂起的一个原因是该进程的时间片已经用完了，必须挂起，然后根据公平调度原则去运行其余进程。所以这里的读管道、写管道进程不一定非要管道空、满了才挂起，一旦该进程的时间片用完了，那么下一次先执行的便是另一个进程，所以常有中间态的情况发生（管道首指针和尾指针位于中间，谁前谁后不一定）。

3.3、读管道——read_pipe

前面说到了LInux 0.11 默认规则，管道满了，就会唤醒读管道进程（唤醒不表示读管道进程可以立即执行）。写管道是移动管道首指针，读管道则是移动管道尾指针。

 管道读操作函数。
// 参数inode 是管道对应的i 节点，buf 是数据缓冲区指针，count 是读取的字节数。
int read_pipe(struct m_inode * inode, char * buf, int count)
{
	int chars, size, read = 0;

	// 若欲读取的字节计数值count 大于0，则循环执行以下操作。
	while (count>0) {
		// 若当前管道中没有数据(size=0)，则唤醒等待该节点的进程，如果已没有写管道者，则返回已读
		// 字节数，退出。否则在该i 节点上睡眠，等待信息。
		while (!(size = PIPE_SIZE(*inode))) {//没有数据可读
			wake_up(&inode->i_wait);
			if (inode->i_count != 2) /* 没有写管道 */
				return read;
			sleep_on(&inode->i_wait);
		}
		// 取管道尾到缓冲区末端的字节数chars。如果其大于还需要读取的字节数count，则令其等于count。
		// 如果chars 大于当前管道中含有数据的长度size，则令其等于size。
		chars = PAGE_SIZE - PIPE_TAIL(*inode);//
		if (chars > count)
			chars = count;
		if (chars > size)
			chars = size;
		// 读字节计数减去此次可读的字节数chars，并累加已读字节数。
		count -= chars;
		read += chars;
		// 令size 指向管道尾部，调整当前管道尾指针（前移chars 字节）。
		size = PIPE_TAIL(*inode);
		PIPE_TAIL(*inode) += chars;
		PIPE_TAIL(*inode) &= (PAGE_SIZE - 1);
		// 将管道中的数据复制到用户缓冲区中。对于管道i 节点，其i_size 字段中是管道缓冲块指针。
		while (chars-->0)
			put_fs_byte(((char *)inode->i_size)[size++], buf++);
	}
	// 唤醒等待该管道i 节点的进程，并返回读取的字节数。
	wake_up(&inode->i_wait);
	return read;
}

读管道进程开始执行后，将从上一次读的位置开始把管道中的数据读出，当操作到管道尾端后也会将读管道指针从管道尾端移动到管道首端，从首端继续读取管道中的内容，直至将数据彻底读完。管道中的数据被读完后，读管道进程将再次被挂起，并切换到写管道进程去执行。

对于读管道操作，如果管道中有数据，它就可以读出数据，如果没有数据，系统就会将它挂起。
对于写管道操作，如果管道中有空间，它就可以写入数据，如果没有空间，系统就会将它挂起。

另外，无论哪种操作，一旦该操作进程的时间片用完了，同样会被挂起，当下次分配时间片时，将会接着上次的写/读位置继续操作。由于管道数据的写入和读出都是在内核代码中进行的，上面用户态进程切换并不会对数据的操作产生影响。虽然读管道进程和写管道进程都在同一个内存页面中进程操作，但数据永远不会出现混乱。

参考资料：（Linux 0.11源码）《Linux 内核设计的艺术》、《Linux 内核设计与实现》

selfimpr1991

关注

5
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
【Linux0.11 内核源码剖析】进程间通信——管道（pipe）

本文介绍IPC之管道通信机制的内部实现机制。首先概述管道通信，然后阐述管道的结构，之后通过剖析Linux 0.11内核源码来分析管道的内部实现机制，最后通过一个实例来阐述管道的应用。知其然，若知其所以然将有利于我们更好的应用它。
复制链接

扫一扫