linux系统编程之文件与io(四)

最新推荐文章于 2024-07-25 22:14:03 发布

webor2006

最新推荐文章于 2024-07-25 22:14:03 发布

阅读量67

点赞数

分类专栏： c研究文章标签：数据结构 python linux java 编程语言

本文链接：https://blog.csdn.net/webor2006/article/details/119750754

版权

c研究专栏收录该内容

55 篇文章 1 订阅

订阅专栏

今天继续学习文件与io，主要是学习文件共享及文件、复制文件描述符，有点抽象，主要是概念上的理解，但是很重要，下面一一来分解：

文件共享:

回顾一下，在linux系统调用中，是通过文件描述符来访问文件的，文件描述符是一个非负的整数，这是站在用户的观点来看的，实际上在linux内核上是有一定的数据结构来表示文件描述符的，下面就从三方面来看图分析一下内核中是怎么来表示打开的文件的：

一个进程打开两个文件内核数据结构：

( 说明：关于这点，可以看一下我之前的博客： http://www.cnblogs.com/webor2006/p/3487718.html)

所以，由于文件描述符0、1、2被占用了，则我们用户打开的文件描述符只能从第3开始了：

如图上所示，对于内核，当打开一个文件时，会有 一张表格来记录文件的状态 ,回顾一下，当我们在读取文件内容的时候，会自动的从当前文件的偏移位置去读取下一个数据,在文件的随机读写中已经介绍过(http://www.cnblogs.com/webor2006/p/3493218.html)，原因就在于这个偏移量就保存在文件表当中的：

而每当我们打开一个文件时，内核就会为文件分配一个文件表，里面有不同的项，其中当前文件偏移量就是一个文件表项

回忆一下，我们打开一个文件，可以以读、写、追加、同步、非阻塞(这个之后会学到)等方式打开，用来描述它的就是另一个文件表项：文件状态标志

另外图中还有一个文件引用计数，它是用来描述一个文件被多少个文件描述符指向了 (这个在下面的复制文件描述符中就可以体会到了):

另外，还有一个文件表项，它是 v节点指针，它指向了 v节点表，如图所示：

其中v节点表中，存放了两项很重要的信息，一个是 v节点信息，一个是 i节点信息:

v节点信息：我们上节学习的stat函数获得文件信息返回的状态信息就全保存在v节点信息里( http://www.cnblogs.com/webor2006/p/3496281.html)：

i节点信息：当我们打开一个文件时，会将文件系统当中的i结点数据拷贝到v节点表中的i节点信息所存放的位置，比如说：

一个进程两次打开同一个文件内核数据结构：

下面以具体代码来进行说明：

#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>


#define ERR_EXIT(m) \
    do \
    { \
        perror(m); \
        exit(EXIT_FAILURE); \
    } while(0)

int main(int argc, char *argv[])
{
    int fd1;
    int fd2;
    char buf1[1024] = {0};
    char buf2[1024] = {0};
    fd1 = open("test.txt", O_RDONLY);//以只读的方式打开文件
    if (fd1 == -1)
        ERR_EXIT("open error");
    read(fd1, buf1, 5);
    printf("buf1=%s\n", buf1);
    

    fd2 = open("test.txt", O_RDWR);//以读写的方式打开文件
    if (fd2 == -1)
        ERR_EXIT("open error");

    read(fd2, buf2, 5);
    printf("buf2=%s\n", buf2);
    
    close(fd1);
    close(fd2);
    return 0;
}

先新建一个test.txt，里面输点测试内容：

编译运行：

也就是各个描述符有各自的偏移量，当buf1输出ABCDE时，如果第二个描述符共享偏移量的话，应该buf2输出FGhel，但是buf2输出的也是ABCDE,也就说明了各个文件描述符有不同的文件表项。

#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>


#define ERR_EXIT(m) \
    do \
    { \
        perror(m); \
        exit(EXIT_FAILURE); \
    } while(0)

int main(int argc, char *argv[])
{
    int fd1;
    int fd2;
    char buf1[1024] = {0};
    char buf2[1024] = {0};
    fd1 = open("test.txt", O_RDONLY);
    if (fd1 == -1)
        ERR_EXIT("open error");
    read(fd1, buf1, 5);
    printf("buf1=%s\n", buf1);
    

    fd2 = open("test.txt", O_RDWR);
    if (fd2 == -1)
        ERR_EXIT("open error");

    read(fd2, buf2, 5);
    printf("buf2=%s\n", buf2);
    write(fd2, "AAAAA", 5);

    memset(buf1, 0, sizeof(buf1));
    read(fd1, buf1, 5);
    printf("buf1=%s\n", buf1);
    close(fd1);
    close(fd2);
    return 0;
}

编译运行：

这结果为什么是它呢？下面来分析下：

write(fd2, "AAAAA", 5);

这时我们先来查看下test.txt的内容：

由于它会改变v节点表中的i节点信息所指向磁盘中的数据，而两个文件描述符的v节点表是共享的，而fd1此时的偏移量为5：

总结：每打开一个文件描述符，就有一个对应的文件表项描述，而如果打开的是同一个文件，v节点表是共享的

两个进程打开同一个文件内核数据结构：

说明：不同的进程可以打开同一个文件，但是每个进程的文件描述符对应一个独立的文件表项，而最终共享v节点表。

总结：文件描述符跟文件不是一一对应的，文件描述符可以有多个，但是文件可以只有一个。

理解了打开的文件在内核中的结构，进而我们就可以理解复制文件描述符是怎么一回事了，如下：

复制文件描述符:

先用图来进行说明：

其中复制文件描述符，可以执行dup命令，注意，这时它会从0开始找出有空闲的文件描述符，如图，0、1、2是已经默认被系统给占用了，这时，执行dup之后，就会找到空闲的fd 4文件描述符，将它也指向同一个文件表，如图：

下面，以一段程序来说明一下 输出重定向的原理，先复习一下什么是输出重定向：

下面，以具体程序来说明它，利用的就是复制文件描述符的知识：

先本地建一个空的test2.txt文件：

分析一下这个程序：

close(1)的作用，就是为了让输出到屏幕的文件描述符成为空闲的，然后dup时，会从0开始找空闲文件描述符，发现1是空闲的，则这时它的内存模型就变成这样了：

所以，清楚了它之后，对于ls > aa这样的输出重定向的功能，就比较容易实现了。

另外，对于复制文件描述符有三种方法:

对于dup2，理解它，我们可以将上面复制文件描述符的程序用dup2代替dup，如下：

编译运行：

另外第三种复制文件描述符的方法，是通过fcntl函数，它稍复杂一些，这个会在下节详细进行分析，先看一下man帮助：

其中第三个参数，可以决定复制文件描述符时，从第几个描述符开始搜索空闲，利用dup实现复制文件描述符时都是从0开始搜索的。

好了，关于fcntl的使用，下节再见！

webor2006

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
linux系统编程之文件与io(四)

今天继续学习文件与io，主要是学习文件共享及文件、复制文件描述符，有点抽象，主要是概念上的理解，但是很重要，下面一一来分解：文件共享:回顾一下，在linux系统调用中，是通过文件描述符来访问文件的，文件描述符是一个非负的整数，这是站在用户的观点来看的，实际上在linux内核上是有一定的数据结构来表示文件描述符的，下面就从三方面来看图分析一下内核中是怎么来表示打开的文件的：一个进程打开两个文...
复制链接

扫一扫