Linux最新Linux-基础IO_linux征途——基础io(3),2024年最新缓存架构技术

最后的话

最近很多小伙伴找我要Linux学习资料,于是我翻箱倒柜,整理了一些优质资源,涵盖视频、电子书、PPT等共享给大家!

资料预览

给大家整理的视频资料:

给大家整理的电子书资料:

如果本文对你有帮助,欢迎点赞、收藏、转发给朋友,让我有持续创作的动力!

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

char \* fgets ( char \* str, int num, FILE \* stream )

   
   
   
   
  • 1

注:

  • 从流中读取字符并将它们作为 C 字符串存储到 str 中,直到读取 (num-1) 个字符到达换行符或文件结尾以先发生者为准
  • 换行符使 fgets 停止读取但它被函数视为有效字符并包含在复制到 str 的字符串中。
  • 在复制到 str 的字符之后会自动附加一个终止空字符
  • fgets 与 get 完全不同:fgets 不仅接受流参数,还允许指定 str 的最大大小并在字符串中包含任何结束的换行符。

在这里插入图片描述
fwrite的使用方法
补充:

  • 当前路径指的是每个进程,都有一个内置的属性cwd
  • fwrite函数如果size_t count传入的数正好将字符串内容全部传入到指定文本中则返回count,否则返回与count不同的数
  • fwrite函数传入内容的大小正好是size_t size,和size_t count的乘积

stdin & stdout & stderr

在这里插入图片描述

  • 任何C程序,都默认打开三个文件分别叫做标准输入(stdin)、标准输出(stdout)、标准错误(stderr)
  • 标准输入(stdin)——键盘文件——读方法(read)
  • 标准输出(stdout)、标准错误(stderr)——显示器文件——写方法(write)
  • Linux下一切皆文件
  • 所有的外设硬件,本质是对应的核心操作无外乎是read和write(不同的硬件对应的读写方式是不一样的)

在这里插入图片描述
在这里插入图片描述
注:

  • 可以通过C接口,直接对stdin、stdout、stderr进行读写
  • C默认会打开三个输入输出流,分别是stdin, stdout, stderr,这样做便于语言进行上手使用,都有输入输出的需求
  • 几乎所有的编程语言都会默认会打开三个输入输出流stdin, stdout, stderr,
  • 任何一种编程语言的文件操作相关的函数(库函数)底层都会调用系统调用接口(open、close、write、read,这些在Linux系统下有,但这些接口不具备可移植性)
  • 语言上相关文件操作的库函数兼容自身语法特征,系统调用使用成本较高,而且不具备可移植性

系统文件I/O

open

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int open(const char pathname, int flags);
int open(const char pathname, int flags, mode_t mode);

pathname: 要打开或创建的目标文件
flags: 打开文件时,可以传入多个参数选项,用下面的一个或者多个常量进行“或”运算,构成flags。
参数:
O_RDONLY: 只读打开
O_WRONLY: 只写打开
O_RDWR : 读,写打开
这三个常量,必须指定一个且只能指定一个
O_CREAT : 若文件不存在,则创建它。需要使用mode选项,来指明新文件的访问权限
O_APPEND: 追加写
返回值:
成功:新打开的文件描述符
失败:-1

注:

  • open 函数具体使用哪个,和具体应用场景相关,如目标文件不存在,需要open创建,则第三个参数表示创建文件的默认权限,否则,使用两个参数的open。
  • O_RDONLY、O_WRONLY、O_RDWR……这些都是系统定义的宏,这些参数只占一个int整形中的一个比特位

在这里插入图片描述
注:write read close lseek…… 与C语言文件相关接口用法类似

文件描述符fd

在这里插入图片描述
注:

  • 用户层看到的fd本质是系统中维护进程和文件对应关系的数组的下标
  • 所谓的默认打开文件,标准输入,标准输出,标准错误,其实是由底层系统支持的,默认一个进程在运行的时候,就打开了0,1,2
  • 对于进程来讲,对所有的文件进行操作,统一使用一套接口(一组函数指针),因此在OS看来一切皆文件

在这里插入图片描述

文件描述符就是从0开始的小整数。当打开文件时,操作系统在内存中要创建相应的数据结构来描述目标文件。于是就有了file结构体。表示一个已经打开的文件对象。而进程执行open系统调用,所以必须让进程和文件关联起来。每个进程都有一个指针files_struct*, 指向一张表files_struct,该表最重要的部分就是包涵一个指针数组,每个元素都是一个指向打开文件的指针!所以,本质上,文件描述符就是该数组的下标。只要拿着文件描述符,就可以找到对应的文件

补充:

  • 标准输入、标准输出、标准错误在对应的文件描述符为0,1,2,对应C语言层上的是stdin、stdout、stderr
  • 所有文件,如果要被使用时,首先必须被打开
  • 一个进程可以打开多个文件,系统中被打开的文件一定有多个,多个被打开的文件,一定要被操作系统管理起来的(先描述(struct file(包含了目标文件的基本操作和部分属性)),再组织(双链表))
  • 打开文件的过程:先在fd_array数组中找一个最小的没有被使用的数组下标位置,然后把新open出的文件的结构体地址填入到数组中去,对应该地址的下标返回给对应的进程
  • fd:本质是进程和文件之间对应关系的数组的下标,有了fd就可以找到打开文件的所有细节

文件描述符的分配规则

在这里插入图片描述

总结:

  • 文件描述符的分配规则:在files_struct数组当中,找到当前没有被使用的
    最小的一个下标,作为新的文件描述符
  • Linux进程默认情况下会有3个缺省打开的文件描述符,分别是标准输入0, 标准输出1, 标准错误2

重定向

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
补充:程序替换的时候不会影响重定向对应的数据结构的数据(程序替换影响的是进程虚拟地址空间部分,而重定向影响的是files_struct部分)

使用 dup2 系统调用

#include <unistd.h>
int dup2(int oldfd, int newfd);

注:

  • newfd使oldfd的一份拷贝,不是拷贝fd而是拷贝fd对应的fd_array数组中的内容

在这里插入图片描述

FILE

因为IO相关函数与系统调用接口对应,并且库函数封装系统调用,所以本质上,访问文件都是通过fd访问的。因此C库当中的FILE结构体内部,必定封装了fd

typedef struct \_IO\_FILE FILE; 在/usr/include/stdio.h
在/usr/include/libio.h
struct \_IO\_FILE {
 int _flags; /\* High-order word is \_IO\_MAGIC; rest is flags. \*/
#define \_IO\_file\_flags \_flags
 //缓冲区相关
 /\* The following pointers correspond to the C++ streambuf protocol. \*/
 /\* Note: Tk uses the \_IO\_read\_ptr and \_IO\_read\_end fields directly. \*/
 char\* _IO_read_ptr; /\* Current read pointer \*/
 char\* _IO_read_end; /\* End of get area. \*/
 char\* _IO_read_base; /\* Start of putback+get area. \*/
 char\* _IO_write_base; /\* Start of put area. \*/
  char\* _IO_write_ptr; /\* Current put pointer. \*/
 char\* _IO_write_end; /\* End of put area. \*/
 char\* _IO_buf_base; /\* Start of reserve area. \*/
 char\* _IO_buf_end; /\* End of reserve area. \*/
 /\* The following fields are used to support backing up and undo. \*/
 char \*_IO_save_base; /\* Pointer to start of non-current get area. \*/
 char \*_IO_backup_base; /\* Pointer to first valid character of backup area \*/
 char \*_IO_save_end; /\* Pointer to end of non-current get area. \*/
 struct \_IO\_marker \*_markers;
 struct \_IO\_FILE \*_chain;
 int _fileno; //封装的文件描述符
#if 0
 int _blksize;
#else
 int _flags2;
#endif
 _IO_off_t _old_offset; /\* This used to be \_offset but it's too small. \*/
#define \_\_HAVE\_COLUMN /\* temporary \*/
 /\* 1+column number of pbase(); 0 is unknown. \*/
 unsigned short _cur_column;
 signed char _vtable_offset;
 char _shortbuf[1];
 /\* char\* \_save\_gptr; char\* \_save\_egptr; \*/
 _IO_lock_t \*_lock;
#ifdef \_IO\_USE\_OLD\_IO\_FILE
};

在这里插入图片描述

总结:

  • FILE结构体中包含了int fileno的成员(也就是系统上的fd文件描述符)
  • fopen、fwrite、fread、fclose等f系列的库函数都是由底层open、write 、read、close实现的,通过open的返回值传给fileno,从而对系统调用函数进行封装
  • struct FILE内部包含:
    1. 底层对应的文件描述符下标
    1. 应用层C语言提供的缓冲区数据
  • 所谓的默认打开文件,标准输入、标准输出、标准错误其实是由底层系统支持的,默认一个进程在运行的时候,就打开了0,1,2

在这里插入图片描述

一般C库函数写入文件时是全缓冲的,而写入显示器是行缓冲。printf fprintf等库函数会自带缓冲区,当发生重定向到普通文件时,数据的缓冲方式由行缓冲变成了全缓冲。而我们放在缓冲区中的数据,就不会被立即刷新,甚至fork之后但是进程退出之后,会统一刷新,写入文件当中。但是fork的时候,父子数据会发生写时拷贝,所以当你父进程准备刷新的时候,子进程也就有了同样的一份数据,随即产生两份数据。write 没有变化,说明没有所谓的缓冲
printf fputs等 库函数会自带缓冲区,而 write 系统调用没有带缓冲区。另外,我们这里所说的缓冲区,都是用户级缓冲区。其实为了提升整机性能,OS也会提供相关内核级缓冲区。 printf fprintf 是库函数, write 是系统调用,库函数在系统调用的“上层”, 是对系统调用的“封装”,但是 write 有内核级缓冲区,而 printf fwrite fputs等缓冲区是用户级缓冲区,由C标准库提供

注:系统调用函数与库函数尽量不要混在一起使用,可能会与统一使用的函数的运行结果有所差异

文件系统

文件:打开的文件、普通未打开的文件
打开的文件:属性与操作方法的表现就是struct file{} 属于内存级文件
普通未打开的文件:磁盘上面未被加载到内存的
文件系统功能:将上述的这些文件管理起来

在这里插入图片描述

磁盘

磁盘是计算机主要的存储介质,可以存储大量的二进制数据,并且断电后也能保持数据不丢失。早期计算机使用的磁盘是软磁盘(Floppy Disk,简称软盘),如今常用的磁盘是硬磁盘(Hard disk,简称硬盘)。

在这里插入图片描述
补充:

  • 内存在操作系统的角度使用的时候,基本单位是4KB,但在使用角度是1字节
  • 磁盘存储的基本单位是扇区(512字节)(磁盘读取的最小单元)
  • 内存与磁盘间IO时,基本单位是4KB,是通过文件系统来完成的
磁盘的划分

我们可以将磁盘想象成磁带(线性结构),将磁盘看成一个线性空间(数组),类型为扇区的数组、数组个数为10亿多

在这里插入图片描述

这样划分就不用让OS读取数据时在哪个盘面、哪个磁道、哪个扇区找了,OS与磁盘映射关系可以通过磁盘驱动来完成,这样也就做到强解耦性。无论换机械硬盘还是固态硬盘,OS都不用改变读取磁盘数据的数据结构,只需改变磁盘的驱动程序即可

注:操作系统读取磁盘数据时的下标——LBA

  • 磁盘经过在OS中的虚拟化成数组,但是所占空间太大,因此需要进行分区化管理,并对该区域进行格式化(写入文件系统(数据和方法))。eg:Windows中的C盘、D盘……
  • 每个分区再进行分组——块组
  • Linux系统下支持多种文件系统:Ext2、Ext3、fs、usb-fs、sysfs、proc

inode

在这里插入图片描述

Linux ext2文件系统,上图为磁盘文件系统图(内核内存映像肯定有所不同),磁盘是典型的块设备,硬盘分区被划分为一个个的block。一个block的大小是由格式化的时候确定的,并且不可以更改。例如mke2fs的-b选项可以设 定block大小为1024、2048或4096字节。而启动块(Boot Block)的大小是确定的,

  • Block Group:ext2文件系统会根据分区的大小划分为数个Block Group。而每个Block Group都有着相同的结构组成。
  • 超级块(Super Block):存放文件系统本身的结构信息。记录的信息主要有:bolck 和 inode的总量,未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个文件系统结构就被破坏了
  • GDT,Group Descriptor Table:块组描述符,描述块组属性信息
  • 块位图(Block Bitmap):Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用
  • inode位图(inode Bitmap):每个bit表示一个inode是否空闲可用。
  • i节点表:存放文件属性 如 文件大小,所有者,最近修改时间等
  • 数据区:存放文件内容

注:

  • Block Group每个块组中都有,但是Super Block并不是每个块组中都有
  • 每一个文件都对应一个inode节点

总结:

  • 基本上,一个文件一个inode(包括文件)
  • inode是一个文件的所有的属性集合(不包含文件名)(空文件也是占据空间的,所有的属性也是数据也要占据空间)
  • 真正表示文件的不是文件名,而是文件的inode编号
  • inode是可以和特定的数据块产生关联的
  • 程序员是通过路径定位的(目录)来定位一个文件,而操作系统是通过目录的Data blocks来确定文件名和inode的映射关系
  • 目录是文件,有独立的inode和数据块
  • 创建一个新文件主要有一下4个操作:
    1. 存储属性 ——内核先找到一个空闲的i节点。内核把文件信息记录到其中。
    1. 存储数据 ——该文件需要存储在三个磁盘块,内核找到了三个空闲块。将内核缓冲区数据缓冲到磁盘的数据区中
    1. 记录分配情况——文件内容按顺序存放(数据块)。内核在inode上的磁盘分布区记录了上述块列表。
    1. 添加文件名到目录——内核将入口添加到目录文件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来。
  • 大多是操作系统在同一个目录下是不允许存在同名文件的
  • 删除文件不需要清空该文件占据的所有的空间数据(只需将该文件的inode和对应的数据块无效化即可(文件对应inode和Block位图中的数字1设置为0,并将该文件所对应的目录中的数据块的关于该文件内容清空即可)
  • Linux下属性和内容是分离的,属性inode保存的(在同一块块组inode编号是不同的,但是跨组的inode编号可能相同),内容Data blocks保存的

补充:

  • inode描述了文件大小和指向数据块的指针
  • 通过inode可获得文件占用的块数
  • 通过inode可实现文件的逻辑结构和物理结构的转换

软硬连接

硬链接:
在这里插入图片描述
硬链接的应用场景:方便进行相对路径的路径的设置
在这里插入图片描述

在这里插入图片描述
因此,可以看出.、…的底层实现是通过硬链接的方式来实现的
注:

  • 真正找到磁盘上文件的并不是文件名,而是inode。 其实在linux中可以让多个文件名对应于同一个inode
  • 在删除文件时干了两件事情:1.在目录中将对应的记录删除,2.将硬连接数-1,如果为0,则将对应的磁盘释放。

软链接:
在这里插入图片描述
注:硬链接是通过inode引用另外一个文件,软链接是通过名字引用另外一个文件

总结:软硬链接的区别:本质是是否是独立文件,有无独立inode;用途:软链接可以指向特定的文件方便进行快速索引,硬链接是能进行相对路径设置

补充:

  • 软链接文件是一个独立的文件有自己的inode节点,通过数据中保存的源文件路径访问源文件
  • 硬链接是文件的一个目录项,与源文件共用同一个inode节点,直接通过自己的inode节点访问源文件
  • 不同分区有可能有不同文件系统,因此硬链接不能跨分区建立;软连接可以跨文件系统进行连接,硬链接不可以
  • 当删除源文件时,软链接文件失效
  • ln生成符号链接文件指的是 ln -s 生成软链接文件

文件的ACM

为了做好运维面试路上的助攻手,特整理了上百道 【运维技术栈面试题集锦】 ,让你面试不慌心不跳,高薪offer怀里抱!

这次整理的面试题,小到shell、MySQL,大到K8s等云原生技术栈,不仅适合运维新人入行面试需要,还适用于想提升进阶跳槽加薪的运维朋友。

本份面试集锦涵盖了

  • 174 道运维工程师面试题
  • 128道k8s面试题
  • 108道shell脚本面试题
  • 200道Linux面试题
  • 51道docker面试题
  • 35道Jenkis面试题
  • 78道MongoDB面试题
  • 17道ansible面试题
  • 60道dubbo面试题
  • 53道kafka面试
  • 18道mysql面试题
  • 40道nginx面试题
  • 77道redis面试题
  • 28道zookeeper

总计 1000+ 道面试题, 内容 又全含金量又高

  • 174道运维工程师面试题

1、什么是运维?

2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的?

3、现在给你三百台服务器,你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?

7、Tomcat和Resin有什么区别,工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 10
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值