复制文件描述符(dup、dup2函数) 和文件共享

最新推荐文章于 2024-07-24 15:58:17 发布

比特冬哥

最新推荐文章于 2024-07-24 15:58:17 发布

阅读量1.2k

点赞数 7

分类专栏： Linux C应用编程文章标签： linux 运维服务器 ubuntu 嵌入式硬件

本文链接：https://blog.csdn.net/Dustinthewine/article/details/126448856

版权

Linux C应用编程专栏收录该内容

37 篇文章 38 订阅

订阅专栏

本文详细介绍了Linux系统中用于复制文件描述符的dup和dup2函数，包括它们的使用方法、区别以及在文件共享中的应用。dup函数可以复制文件描述符，而dup2则允许指定新文件描述符。通过这两个函数，可以实现多个文件描述符共享同一文件，进而实现文件的并发读写。此外，文章还探讨了文件共享的概念及其在多进程、多线程编程中的重要性，并列举了多种文件共享的实现方式。

摘要由CSDN通过智能技术生成

一、复制文件描述符

在 Linux 系统中，open 返回得到的文件描述符 fd 可以进行复制，复制成功之后可以得到一个新的文件描述符，使用新的文件描述符和旧的文件描述符都可以对文件进行 IO 操作，复制得到的文件描述符和旧的文件描述符拥有相同的权限，譬如使用旧的文件描述符对文件有读写权限，那么新的文件描述符同样也具有读写权限；在 Linux 系统下，可以使用 dup 或 dup2 这两个系统调用对文件描述符进行复制，本节介绍这两个函数的用法以及它们之间的区别。

复制得到的文件描述符与旧的文件描述符都指向了同一个文件表，假设 fd1 为原文件描述符，fd2 为复
制得到的文件描述符，如下图所示：
在这里插入图片描述
因为复制得到的文件描述符与旧的文件描述符指向的是同一个文件表，所以可知，这两个文件描述符的属性是一样，譬如对文件的读写权限、文件状态标志、文件偏移量等，所以从这里也可知道“复制”的含义实则是复制文件表。同样，在使用完毕之后也需要使用 close 来关闭文件描述符。

dup 函数

dup 函数用于复制文件描述符，此函数原型如下所示（可通过"man 2 dup"命令查看）：

#include <unistd.h>
int dup(int oldfd);

首先使用此函数需要包含头文件<unistd.h>。
函数参数和返回值含义如下：
oldfd：需要被复制的文件描述符。
返回值：成功时将返回一个新的文件描述符，由操作系统分配，分配置原则遵循文件描述符分配原则；如果复制失败将返回-1，并且会设置 errno 值。

测试
由前面的介绍可知，复制得到的文件描述符与原文件描述符都指向同一个文件表，所以它们的文件读写偏移量是一样的，那么是不是可以在不使用O_APPEND标志的情况下，通过文件描述符复制来实现接续写，测试代码如下所示：

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main(void) 
{
	 unsigned char buffer1[4], buffer2[4];
	 int fd1, fd2;
	 int ret;
	 int i;
	 
	 /* 创建新文件 test_file 并打开 */
	 fd1 = open("./test_file", O_RDWR | O_CREAT | O_EXCL,S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH);
	 if (-1 == fd1) 
	 {
		 perror("open error");
		 exit(-1);
	 }
	 
	 /* 复制文件描述符 */
	 fd2 = dup(fd1);
	 if (-1 == fd2) 
	 {
		 perror("dup error");
		 ret = -1;
		 goto err1;
	 }
	 printf("fd1: %d\nfd2: %d\n", fd1, fd2);
	 
	 /* buffer 数据初始化 */
	 buffer1[0] = 0x11;
	 buffer1[1] = 0x22;
	 buffer1[2] = 0x33;
	 buffer1[3] = 0x44;
	 buffer2[0] = 0xAA;
	 buffer2[1] = 0xBB;
	 buffer2[2] = 0xCC;
	 buffer2[3] = 0xDD;
	 
	 /* 循环写入数据 */
	 for (i = 0; i < 4; i++) 
	 {
		 ret = write(fd1, buffer1, sizeof(buffer1));
		 if (-1 == ret) 
		 {
			 perror("write error");
			 goto err2;
		 }	 
		 ret = write(fd2, buffer2, sizeof(buffer2));
		 if (-1 == ret) 
		 {
			 perror("write error");
			 goto err2;
		 }
	 }
	 
	 /* 将读写位置偏移量移动到文件头 */
	 ret = lseek(fd1, 0, SEEK_SET);
	 if (-1 == ret) 
	 {
		 perror("lseek error");
		 goto err2;
	 }
	 
	 /* 读取数据 */
	 for (i = 0; i < 8; i++) 
	 {
		 ret = read(fd1, buffer1, sizeof(buffer1));
		 if (-1 == ret) 
		 {
			 perror("read error");
			 goto err2;
		 }
	 printf("%x%x%x%x", buffer1[0], buffer1[1],buffer1[2], buffer1[3]);
	 }
	 printf("\n");
	 ret = 0;
	 
	err2:
	 close(fd2);
	err1:
	 /* 关闭文件 */
	 close(fd1);
	 exit(ret);
}

测试代码中，使用 dup 系统调用复制了文件描述符 fd1，得到另一个新的文件描述符 fd2，分别通过 fd1 和 fd2 对文件进行写操作，最后读取写入的数据来判断是分别写还是接续写，编译测试：
在这里插入图片描述
由打印信息可知，fd1 等于 6，复制得到的新的文件描述符为 7（遵循 fd 分配原则），打印出来的数据显示为接续写，所以可知，通过复制文件描述符可以实现接续写。

dup2 函数

dup 系统调用分配的文件描述符是由系统分配的，遵循文件描述符分配原则，并不能自己指定一个文件描述符，这是 dup 系统调用的一个缺陷；而 dup2 系统调用修复了这个缺陷，可以手动指定文件描述符，而不需要遵循文件描述符分配原则，当然在实际的编程工作中，需要根据自己的情况来进行选择。

dup2 函数原型如下所示（可以通过"man 2 dup2"命令查看）：

#include <unistd.h>
int dup2(int oldfd, int newfd);

同样使用该命令也需要包含<unistd.h>头文件。
函数参数和返回值含义如下：
oldfd：需要被复制的文件描述符。
newfd：指定一个文件描述符（需要指定一个当前进程没有使用到的文件描述符）。
返回值：成功时将返回一个新的文件描述符，也就是手动指定的文件描述符 newfd；如果复制失败将返回-1，并且会设置 errno 值。

测试

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>

int main(void) 
{
	 int fd1, fd2;
	 int ret;
	 
	 /* 创建新文件 test_file 并打开 */
	 fd1 = open("./test_file", O_RDWR | O_CREAT | O_EXCL,S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH);
	 if (-1 == fd1) 
	 {
		 perror("open error");
		 exit(-1);
	 }
	 
	 /* 复制文件描述符 */
	 fd2 = dup2(fd1, 100);
	 if (-1 == fd2) 
	 {
		 perror("dup error");
		 ret = -1;
		 goto err1;
	 }
	 printf("fd1: %d\nfd2: %d\n", fd1, fd2);
	 ret = 0;
	 close(fd2);
	 
	err1:
	 /* 关闭文件 */
	 close(fd1);
	 exit(ret);
}

测试代码使用 dup2 函数复制文件描述符 fd1，指定新的文件描述符为 100，复制成功之后将其打印出
来，结果如下所示：
在这里插入图片描述

由打印信息可知，复制得到的文件描述符 fd2 等于 100，正是在 dup2 函数中指定的文件描述符。文件描述符并不是只能复制一次，实际上可以对同一个文件描述符 fd 调用 dup 或 dup2 函数复制多次，得到多个不同的文件描述符。

二、文件共享

什么是文件共享？
所谓文件共享指的是同一个文件（譬如磁盘上的同一个文件，对应同一个 inode）被多个独立的读写体同时进行 IO 操作。多个独立的读写体大家可以将其简单地理解为对应于同一个文件的多个不同的文件描述符，譬如多次打开同一个文件所得到的多个不同的 fd，或使用 dup()（或 dup2）函数复制得到的多个不同的 fd 等。

同时进行 IO 操作指的是一个读写体操作文件尚未调用 close 关闭的情况下，另一个读写体去操作文件，前面给大家编写的示例代码中就已经涉及到了文件共享的内容了，同一个文件对应两个不同的文件描述符 fd1 和 fd2，当使用 fd1 对文件进行写操作之后，并没有关闭 fd1，而此时使用 fd2 对文件再进行写操作，这其实就是一种文件共享。

文件共享的意义有很多，多用于多进程或多线程编程环境中，譬如我们可以通过文件共享的方式来实现多个线程同时操作同一个大文件，以减少文件读写时间、提升效率。
文件共享的核心是：如何制造出多个不同的文件描述符来指向同一个文件。其实方法在上面的内容中都已经给大家介绍过了，譬如多次调用 open 函数重复打开同一个文件得到多个不同的文件描符、使用 dup()或 dup2()函数对文件描述符进行复制以得到多个不同的文件描述符。

常见的三种文件共享的实现方式
(1)同一个进程中多次调用 open 函数打开同一个文件，各数据结构之间的关系如下图所示：
在这里插入图片描述
多次调用 open 函数打开同一个文件会得到多个不同的文件描述符，并且多个文件描述符对应多个不同的文件表，所有的文件表都索引到了同一个 inode 节点，也就是磁盘上的同一个文件。

(2)不同进程中分别使用 open 函数打开同一个文件，其数据结构关系图如下所示：
在这里插入图片描述
进程 1 和进程 2 分别是运行在 Linux 系统上两个独立的进程（理解为两个独立的程序），在他们各自的程序中分别调用 open 函数打开同一个文件，进程 1 对应的文件描述符为 fd1，进程 2 对应的文件描述符为fd2，fd1 指向了进程 1 的文件表 1，fd2 指向了进程 2 的文件表 2；各自的文件表都索引到了同一个 inode 节点，从而实现共享文件。