【Linux】基础IO——系统文件IO&fd&重定向&理解_linux fd0(1)

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

//返回值
return the new file descriptor, or -1 if an error occurred (in which case, errno is set appropriately)
//成功:打开文件描述符
//失败:返回-1

  • close

man 2 close

//头文件
#include <unistd.h>
//参数
int close(int fd);

同时,O_CREAT:文件不存在,则需要我们去创建它,并不会自动创建好哈。也要使用mode选项,来指明此时新文件的权限。

注意:O_CREAT是一个建议选项,文件存在还是不存在都可以使用

image-20221216110218005

1.我们发现了open并没有去帮我们自动创建文件。以写的方式去创建方式并没有自动创建,想啥呢哈哈。而在C语言封装了会帮我们自动创建,但是对于系统接口我们需要加上O_CREAT(文件不存在自动创建).最终成功帮我们自动创建成功!!!

**2.但是对于log.txt文件创建了,权限是乱的,但是文件默认以什么权限创建?我们默认情况下目录以777,普通文件以666开始,**这些都是通过open的第三个参数mode选项设置权限的,设定创建默认文件的权限

使用mode选项设置权限,我们一起来看一看:

image-20221216110343536

我们可以设置unmask改变权限:

image-20221216115723673

此时log.txt的权限才是664,与C语言创建的默认权限就一致了!

umask小细节

我们如果想创建文件的权限如果不想受系统影响,也可以自己定义创建文件的野码

换句话来说:我们默认使用的是系统给我们所提供的umak,也就是父shell给我们提供的,而子进程会继承,所以我们很容易知道子进程对应的野码是多少。但是如果我们不想受系统野码影响限制权限,我们就可以在我们自己的子进程使用umask(0)清空野码(也就是上面的代码)image-20221218234930208

但是此时父进程shell的umask结果还是0002,我们改变的是子进程的文件权限,因为进程具有独立性,并不会影响父进程的umask

这就是在这里所说的umask小细节,值得注意一下。

2.read和write
1.write

文件打开和关闭说完之后,自然就是我们的写入接口了

//man 2 write
#include <unistd.h>
//把一个文件先描述符输入
ssize_t write(int fd, const void *buf, size_t count);

fd:所写的文件

buf:缓冲区数据,参数是void*,这从侧面说明了很多的东西:我们之前所说,文件读取分为文本类和二进制类,这是对于语言所提供的文件读取的分类。但是在操作系统看来,都是void*,也就是二进制!

count:缓冲区所写的字节个数

返回值:返回写入的字节数,在这里我们并不太需要关注返回值

sprintf:将特定的内容格式化到字符串

话不多说,我们直接代码练习:

#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <assert.h>
#define FILE_NAME "log.txt"
int main()
{
    umask(0);
    int fd = open(FILE_NAME,O_WRONLY | O_CREAT,0666);
    if(fd<0)
    {
        perror("open");
        return 1;
    }
    int cnt = 5;
    char outBuffer[64];
    while(cnt)
    {
        sprintf(outBuffer,"%s:%d\n","helloworld",cnt--);
        
        write(fd,outBuffer,strlen(outBuffer)+1);  //注意这个地方+1了                                                 
    }
    close(fd);
}

image-20221219001548321

结果很正常,符合我们的预期,但是我们以文本打开:

  • string+1出现乱码问题

image-20221219001235543

出现上面这种情况乱码问题,实际是当我们向文件写入string的时候,要不要加1的问题?

\0作为字符串的结尾,是C语言的规定,和文件并没有什么关系,是有效内容结尾。所以我们并不需要+1。这又是一个小细节

image-20221219003844530

  • 清空问题

image-20221219004148371

我们发现,在这里,当我们重新打印内容时,居然还残留着上一次所打印的helloworld,这并没有帮我们自动清空内容,需要我们自己添加选项内容(而在C语言中,我们一开始说的细节:以w方式单纯的打开文件,c会自动清空内部的数据,这是封装好的)。

清空内容需要带上O_TRUNC:

image-20221219005441008

此时如果我们就打开和关闭,所有内容也会被清空:

#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <assert.h>
#define FILE_NAME "log.txt" 
int main()
{
    umask(0);
    int fd = open(FILE_NAME,O_WRONLY | O_CREAT | O_TRUNC,0666);
    if(fd<0)
    {
        perror("open");
        return 1;
    }                                                                                             
    close(fd);
}

image-20221219005845857

通过上面的这些内容,我们知道,在操作系统上层一个简单的"w"选项,操作系统底层就需要我们传O_WROLY(写入),O_CREAT(不存在则创建),O_TRUNC(清空),以及传入属性!这就是C语言与系统接口的联系。

  • 追加O_APPEND

image-20221219091326874

2.read

image-20221219212743663

从一个文件描述符中读取文件

//头文件
#include <unistd.h>
//返回值ssize_t系统定制类型
ssize_t read(int fd, void *buf, size_t count);

此时读文件需要用到选项O_RDONLY

返回值:

image-20221219212857501

成功返回读取到多少个字节,0代表读到文件结尾。

读文件的前提是文件已经是存在的了,不涉及创建和权限的问题。

下面,进入代码演示环节:

image-20221219213456369

3.小总结

小总结:我们上面学习了open/close/write/read接口,当然还有lseek接口,这里就不展开说了

实际上,这上面四个系统调用接口就对应着C语言的fopen/fclose/fwrite/fread,以及fseek库接口。

image-20221219214336022

上面的 fopen fclose fread fwrite 都是C标准库当中的函数,我们称之为库函数(libc)。
而open close read write lseek 都属于系统提供的接口,称之为系统调用接口


三、理解文件

1.文件操作的本质:进程和被打开文件的关系

2.进程可以打开多个文件,这也就意味着系统中一定会存在大量的被打开的文件,然而被打开的文件则需要被操作系统管理,我们知道,管理的本质就是先描述在组织,所以操作系统为了管理对应的打开文件,操作系统必定要为文件创建对应的内核数据结构来标识文件,这个内核数据结构就是struct file{}结构体(与C语言的FILE没有关系哦);包含了文件的大部分属性

**3.而进程和被打开的文件如何关联,也就是说进程和被打开文件的关系是如何维护的?**通过文件打开(open)的返回值和文件描述符进行联系。

下面我们通过代码来看一看返回值究竟是多少

#include <stdio.h>  
#include <unistd.h>  
#include <string.h>  
#include <sys/types.h>  
#include <sys/stat.h>  
#include <fcntl.h>  
#include <assert.h>  
#define FILE_NAME(number) "log.txt"#number     
int main()  
{
    umask(0);  
    int fd0 =open(FILE_NAME(1),O_WRONLY | O_CREAT | O_APPEND,0666);  
    int fd1 =open(FILE_NAME(2),O_WRONLY | O_CREAT | O_APPEND,0666);  
    int fd2 =open(FILE_NAME(3),O_WRONLY | O_CREAT | O_APPEND,0666);  
    int fd3 =open(FILE_NAME(4),O_WRONLY | O_CREAT | O_APPEND,0666);  、
    int fd4 =open(FILE_NAME(5),O_WRONLY | O_CREAT | O_APPEND,0666);  
    printf("fd: %d\n",fd0);  
    printf("fd: %d\n",fd1);  
    printf("fd: %d\n",fd2);  
    printf("fd: %d\n",fd3);  
    printf("fd: %d\n",fd4);  
    close(fd0);
    close(fd1);
    close(fd2);
    close(fd3);
    close(fd4);    
}

image-20221219215843210

为什么从3开始???👇


四、文件描述符fd

1.引入

看到上面的结果,open的返回值为什么是从3开始的,那0,1,2跑哪里去了呢,而且还是连续的小整数(说到连续,我们想到的是数组下标连续)

在C语言阶段,我们知道C程序会默认打开三个标准输入输出流:stdin(标准输入设备键盘).stout(输出设备显示器).stderr(显示器)

*而对于C语言的FILE,我们对其并不太了解:c语言的FILE究竟是何方神圣?这实际上是一个结构体!访问文件时,底层open必须采用系统调用,而系统调用接口访问文件必须用文件描述符,而在C语言用的并不是文件描述符,而是FILE,所以这个FILE结构体必定有一个文件描述符的字段。所以C语言不仅在接口上有封装,连数据类型都有封装。**

所以,我们可以查看到stdin,stout,stderr里面对应的值是多少:

image-20221219223133032

这就很好的解答了为什么open的返回值是从3开始的问题!因为0,1,2默认被占用,我们的C语言封装了接口,同时也封装了操作系统内的文件描述符。

此外,数字为什么从0,1,2连续的整数,文件描述符的本质是什么?

2.理解

文件描述符的本质是数组的下标

image-20221220162335757

一个文件如果没有被打开那就是在磁盘上的,而要操作文件,就需要打开文件,把文件相关的属性信息从磁盘加载到内存,操作系统中会存在大量的进程,一个进程可以打开多个文件,所以操作系统要把很多的文件在内存中管理起来,如何管理?先描述,在组织。OS为了管理每一个打开的文件,构造了struct file对象,那打开那么的文件,OS为了让进程和文件之间产生关联,进程创建struct file_struct的结构,同时里面包含了数组struct file*fd_array[]指针数组,把描述文件的结构体对象地址填充到对应的下标之中

这也就很好结社了为什么打开文件返回值为3,打开文件内核会描述struct file结构,把对应的地址填充到struct file*fd_array[]数组中的下标中去,又因为0,1,2,默认会被占用,于是从3号下标开始,对应的数组下标返回给用户,这样就能找到进程的文件描述符表,找到对应的文件了。

**这也就是为什么文件操作系统读到的数是整数,而且是连续的,因为文件操作系统内标记进程和文件之间的关系就是文件描述符表,用数组标定文件内容!**通过文件描述符来访问文件!

3.分配规则

文件描述符说白了就是数组的下标。下面,我们进入的是文件描述符的分配规则。

既然默认会打开0,1,2,那我们如果将其关闭呢

image-20221220180049971

*一个文件被打开是进程被打开,进程的task_struct,被打开的文件struct_file,进程和被打开的文件通过文件描述符表struct files_struct里面包含一个数组struct file fd_array[]指向对应文件的数组,里面写着被打开文件的地址,下标对应着填充的文件对象。进程找到自己的文件描述符表传入对应的下标值访问对应的文件。当我们把0关掉了,没有被占用,此时如果在创建一个文件对象,会在自己的文件描述符表从小到大按照顺序寻找最小的且没有被占用的fd.**

fd的分配规则总结一句话:从小到大按照顺序寻找最小的且没有被占用的fd。而默认会把0,1,2占用了,所以一开始文件描述符是3.当我们把0关闭,0没有被占用,那文件描述符那就是0了。

看到这里,如果细心的话就会发现,前面我们都没有close(1),那close(1)会发生什么问题?👇这又引出了另外一个问题

4.close(1)问题

根据前面所说的分配规则:我们可以知道,当我们关闭1时,此时1不在指向标准输出(显示器),不在向显示器打印,当我们打开文件的时候,系统会存在文件对象,然后在把文件的地址在files_struct找一个最小的没有被使用的文件描述符,此时是1,此时就把文件的地址填入1的下标里,在把1号文件描述符返回给上层,此时fd就拿到返回值1。

但是结果是1吗?

image-20221224093013256

但是我们运行并没有看到结果,原因是因为:printf实际就是向stdout打印的。

我们向标准输出显示器进行打印的时候,默认是向stdout打印,而stdout的文件描述符封装了1,当我们进行文件操作的时候,都是在向stdout打印,而stdout的fd都是1,当1号文件描述符没变,里面的指向发生了变化,指向了新打开的文件。
注意:此时打印的结果并没有在新打开的文件里,这是因为缓冲区的问题,没有被显示出来

image-20221224093111028

此时我们刷新缓冲区,即可看到结果:

image-20221224093405188

本来我们应该把打印往显示器文件里打印,最后经过我们的一系列操作把输出的结果写到了文件里。也就是本来应该写到显示器,却写到了文件,这种特性我们称之为重定向!


五、重定向

1.重定向

重定向我们最早接触就是>输出;>>追加;<输入

重定向最典型的特征就是在上层调用不变的情况下,改变底层的数组方向:比如调用fwrite(stdout,…);无论如何调用,上层都会用到stdin(标准输入),stdout(标准输出),stderr(标准错误),也就是0,1,2不变,当我们把3号描述符的指针指向1号描述符,1本来是指向标准输出的,此时1却指向了新打开的文件.

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值