文件系统,文件类型,文件的打开与关闭,文件的内核结构,文件描述符
文件系统的物理结构
用N极S极对应二进制
固态硬盘也模拟出扇区,分区的概念,但是是电介质
i节点中记录文件的元数据和数据块编号
元数据:属性信息(ls -l得到的信息为其中一部分),如hello.c文件的属性信息
数据块编号:通过数据块编号找到数据块
i节点配合数据块完成hello.c文件的存储,通过文件名能找到该文件的i节点,得到属性信息和数据块编号,又通过数据块编号得到数据块
目录也是文件,有自己的i节点
目录文件的数据块存的是该目录下子成员的名和i节点号的对应关系
/home/zc/hello.c
根目录的i节点号在磁盘中的存储位置是固定的
从根目录的i节点找根目录的数据块,找到home文件的i节点号
在home的i节点中找home的数据块,找到zc文件的i节点号
在zc中找到zc的i节点,从而找到zc的数据块,在其中找到hello.c文件的i节点号
文件类型
linux下文件类型分为7种:普通文件,目录文件,符号链接文件,以及4种特殊文件
硬链接:文件名与i节点号的对应,一个i节点号可能对应多个文件名,一个i节点对应2个文件名,就是2个硬链接,对应5个文件名,就是5个硬链接
ln abc.txt def.txt
vi abc.txt与vi def.txt访问的是相同的内容
对目录来说,至少两个硬链接,一个是目录名,一个是.
day02有4个硬链接,day02,day02中的.,shared中的..,static中的..
xyz.txt看到的内容与abc.txt,def.txt相同
xyz的i节点号与abc def不同
通过xyz的i节点找到的数据块存的是abc的完整路径
软链接:即符号链接文件,类似于windows快捷方式
文件的打开与关闭
打开/创建文件 open函数
c中fopen底层调用的就是open
只读,只写,读写3选1
rwx rwx rwx rw- rw- r--
421 421 421 0777 420 420 400 0664 用八进制数表示权限
返回值为int类型,称为文件描述符
FILE* fp = fopen();后续对文件的操作通过fp实现
int fd = open();同理,后续对文件的操作通过fd实现
关闭文件 close函数
返回值:成功返回0,失败返回-1
实际创建出的权限为0775,无其他用户写权限
open进程有自己的权限掩码,0777 变为 0775
权限掩码起保险作用
文件的内核结构
从磁盘中拷贝一份i节点信息与其他一些关键信息到内存中,称为v节点(为结构体)
磁盘空间用块位图表示空闲/占用
文件描述符
程序的执行离不开内核的管理,操作系统会为每一个正在执行的程序维护一个进程表/进程描述符/进程控制块/PCB,该进程表本质为一个特别复杂的结构体,每一个进程都有这么一个结构体,a.out有自己的结构体,b.out有自己的结构体
其中有一个成员为文件描述符表,可想象为一个指针数组,fd = 3为文件表项指针条目的下标
设磁盘中有文件hello.c,有该文件的i节点与数据块
设有进程a.out,执行顺序从main函数到return 0
内核为该进程维护进程表,a.out运行到open(),调用open函数打开hello.c文件
内核要开始为此次打开操作维护数据,维护v节点与文件表项,地址不能直接告诉用户
所以内核要用文件描述符表存文件表项的地址,该地址放到编号为3的数组元素中,将3作为open函数的返回值fd,通过它代表打开的文件
close(3);3对close函数来说代表去文件描述符表寻找下标为3的条目,该条目装着文件表项指针(文件表项的地址),通过指针找到文件表项,找到v节点,关闭释放
文件表项指针不再指向该文件表项,3条目空闲
程序执行结束return 0,内核将进程表释放
scanf() -> 从文件描述符0获取数据 -> 默认对应键盘
printf() -> 向文件描述符1写数据 -> 默认对应显示器
perror() -> 向文件描述符2输出内容 ->默认对应显示器
如果让0对应某个文件如in.txt,scanf读数据相当于从in.txt内读
如果让1对应某个文件如out.txt,printf写数据相当于写入out.txt
输出重定向./a.out >hello.txt,操作系统将a.out的文件描述符指向hello.txt文件
fd = 3输出到hello.txt而不是屏幕
open函数返回的是当前最小未占用的文件描述符,close(0),0空闲
此时in.txt内为123 456,out.txt内为空
第一个open为打开已存在,不涉及创建
编译,执行a.out
scanf从in.txt获取数据
printf没有输出到屏幕,输出到了out.txt中