2024年【Linux从0到1】第八篇：基础IO_从o到io的数，面试题解析已整理成文档-CSDN博客

本文链接：https://blog.csdn.net/2401_84976176/article/details/138810216

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上C C++开发知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以戳这里获取

在这里插入图片描述

回忆一下我们讲操作系统概念时，画的一张图

在这里插入图片描述
系统调用接口和库函数的关系，一目了然。
所以，可以认为，f#系列的函数，都是对系统调用的封装，方便二次开发

三、文件描述符fd

3.1 什么是文件描述符

通过对open函数的学习，我们知道了文件描述符就是一个小整数
在这里插入图片描述

那么怎么解释呢？

在这里插入图片描述
0 & 1 & 2

Linux进程默认情况下会有3个缺省打开的文件描述符，分别是标准输入0，标准输出1，标准错误2.
0,1,2对应的物理设备一般是：键盘，显示器，显示器
所以输入输出还可以采用如下方式

而现在知道，文件描述符就是从0开始的小整数。当我们打开文件时，操作系统在内存中要创建相应的数据结构来描述目标文件。于是就有了file结构体。表示一个已经打开的文件对象。而进程执行open系统调用，所以必须让进程和文件关联起来。每个进程都有一个指针*files, 指向一张表files_struct,该表最重要的部分就是包涵一个指针数组，每个元素都是一个指向打开文件的指针！所以，本质上，文件描述符就是该数组的下标。所以，只要拿着文件描述符，就可以找到对应的文件

3.2 文件描述符的分配规则

直接看代码
在这里插入图片描述

输出发现是 fd: 3
关闭0或者2，在看

发现是结果是： fd: 0 或者 fd 2 可见，文件描述符的分配规则：在files_struct数组当中，找到当前没有被使用的最小的一个下标，作为新的文件描述符

3.3 重定向

那如果关闭1呢？看代码：
在这里插入图片描述

此时，我们发现，本来应该输出到显示器上的内容，输出到了文件 myfile 当中，其中，fd＝1。这种现象叫做输出重定向。常见的重定向有:>, >>, <

追加重定向>>
在这里插入图片描述

在这里插入图片描述
那重定向的本质是什么呢？

1和2都是往显示器上打印，那么他们有什么不同呢？

在这里插入图片描述

四、使用 dup2 系统调用

在这里插入图片描述

五、FILE

因为IO相关函数与系统调用接口对应，并且库函数封装系统调用，所以本质上，访问文件都是通过fd访问的。
所以C库当中的FILE结构体内部，必定封装了fd，也维护了与C缓冲区相关的内容。

显示器刷新方式是行缓冲，而其他文件的刷新方式是全缓冲
我们提前将1关闭，打开了一个新文件，根据文件描述符分配规则，这个文件的fd就是1，那么刷新方式也就有行缓冲变为了全缓冲，如果我们没有提前关闭fd，那么程序退出数据就会自动从C缓冲区刷新到OS缓冲区中，也就会在文件中看到hello world，但是此时如果我们提前将fd关闭，那么就不会刷新到文件中，也就不会看到hello world

在这里插入图片描述

再看一个例子

这是因为显示器的刷新策略是行刷新，在我们关闭标准输出的时候数据已经由C缓冲区刷新到OS缓冲区了，所以我们会在屏幕上看到打印的三条消息，但是我们重定向到文件当中的时候，刷新策略由行缓冲变为了全缓冲，再关闭标准输出，所以数据就不会刷新到OS缓冲区中，也就不会在文件中看到hello world，但是为什么可以在文件中看到hello标准输出呢？因为write是系统调用接口，直接就会写入到OS缓冲区。

在这里插入图片描述

一般C库函数写入文件时是全缓冲的，而写入显示器是行缓冲。
printf fwrite 库函数会自带缓冲区（进度条例子就可以说明），当发生重定向到普通文件时，数据的缓冲方式由行缓冲变成了全缓冲。
而我们放在缓冲区中的数据，就不会被立即刷新，甚至fork之后
但是进程退出之后，会统一刷新，写入文件当中。
但是fork的时候，父子数据会发生写时拷贝，所以当你父进程准备刷新的时候，子进程也就有了同样的一份数据，随即产生两份数据。
write 没有变化，说明没有所谓的缓冲

解决方法就是提前刷新到OS缓冲区
在这里插入图片描述

如果有兴趣，可以看看FILE结构体

typedef struct _IO_FILE FILE; 在/usr/include/stdio.h

在/usr/include/libio.h
struct \_IO\_FILE {
	int _flags; /\* High-order word is \_IO\_MAGIC; rest is flags. \*/
#define \_IO\_file\_flags \_flags
	//缓冲区相关
	/\* The following pointers correspond to the C++ streambuf protocol. \*/
	/\* Note: Tk uses the \_IO\_read\_ptr and \_IO\_read\_end fields directly. \*/
	char\* _IO_read_ptr; /\* Current read pointer \*/
	char\* _IO_read_end; /\* End of get area. \*/
	char\* _IO_read_base; /\* Start of putback+get area. \*/
	char\* _IO_write_base; /\* Start of put area. \*/
	char\* _IO_write_ptr; /\* Current put pointer. \*/
	char\* _IO_write_end; /\* End of put area. \*/
	char\* _IO_buf_base; /\* Start of reserve area. \*/
	char\* _IO_buf_end; /\* End of reserve area. \*/
	/\* The following fields are used to support backing up and undo. \*/
	char \*_IO_save_base; /\* Pointer to start of non-current get area. \*/
	char \*_IO_backup_base; /\* Pointer to first valid character of backup area \*/
	char \*_IO_save_end; /\* Pointer to end of non-current get area. \*/
	struct \_IO\_marker \*_markers;
	struct \_IO\_FILE \*_chain;
	int _fileno; //封装的文件描述符
#if 0
	int _blksize;
#else
	int _flags2;
#endif
	_IO_off_t _old_offset; /\* This used to be \_offset but it's too small. \*/
#define \_\_HAVE\_COLUMN /\* temporary \*/
	/\* 1+column number of pbase(); 0 is unknown. \*/
	unsigned short _cur_column;
	signed char _vtable_offset;
	char _shortbuf[1];
	/\* char\* \_save\_gptr; char\* \_save\_egptr; \*/
	_IO_lock_t \*_lock;
#ifdef \_IO\_USE\_OLD\_IO\_FILE
};

在这里插入图片描述

六、理解文件系统

我们使用ls -l的时候看到的除了看到文件名，还看到了文件元数据
在这里插入图片描述

每行包含7列：

inode（系统用来标识文件）
模式0
硬链接数
文件所有者
组
大小
最后修改时间
文件名

ls -l读取存储在磁盘上的文件信息，然后显示出来
在这里插入图片描述

6.1 inode

为了能解释清楚inode我们先简单了解一下文件系统
在这里插入图片描述
Linux ext2文件系统，上图为磁盘文件系统图（内核内存映像肯定有所不同），磁盘是典型的块设备，硬盘分区被划分为一个个的block。一个block的大小是由格式化的时候确定的，并且不可以更改。例如mke2fs的-b选项可以设定block大小为1024、2048或4096字节。而上图中启动块（Boot Block）的大小是确定的，

Block Group：ext2文件系统会根据分区的大小划分为数个Block Group。而每个Block Group都有着相同的结构组成。政府管理各区的例子
超级块（Super Block）：存放文件系统本身的结构信息。记录的信息主要有：bolck 和 inode的总量，未使用的block和inode的数量，一个block和inode的大小，最近一次挂载的时间，最近一次写入数据的时间，最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏，可以说整个文件系统结构就被破坏了
GDT，Group Descriptor Table：块组描述符，描述块组属性信息，有兴趣的同学可以在了解一下
块位图（Block Bitmap）：Block Bitmap中记录着Data Block中哪个数据块已经被占用，哪个数据块没有被占用
inode位图（inode Bitmap）：每个bit表示一个inode是否空闲可用。
i节点表:存放文件属性如文件大小，所有者，最近修改时间等数据区：存放文件内容
数据区：存放文件内容

将属性和数据分开存放的想法看起来很简单，但实际上是如何工作的呢？我们通过touch一个新文件来看看如何工作
在这里插入图片描述

目录也是文件，那么目录里面存放的是什么呢？文件名：inode编号

创建一个新文件主要有一下4个操作：

存储属性
内核先找到一个空闲的i节点。内核把文件信息记录到其中
存储数据
该文件需要存储在三个磁盘块，内核找到了三个空闲块：300,500，800。将内核缓冲区的第一块数据复制到300，下一块复制到500，以此类推。
记录分配情况
文件内容按顺序300,500,800存放。内核在inode上的磁盘分布区记录了上述块列表
添加文件名到目录
新的文件名myfile。linux如何在当前的目录中记录这个文件？内核将入口（790808，myfile）添加到目录文件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来。