文件操作IO、文件描述符
系统级IO:系统调用接口(open 、close、write、read)
open(打开文件)
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode)
//返回值:打开成功,返回新打开的文件描述符,打开失败,返回-1
//pathname:要打开或创建的目标文件
//flags标记位:打开方式
flags标记位:打开文件时,可以传入多个参数选项,用下面的一个或者多个宏进行“或”运算:
O_RDONLY
:只读打开O_WRONLY
:只写打开O_RDWR
:读,写打开O_APPEND
:追加写数据O_CREAT
: 若文件不存在,则创建它,需要使用mode选项,来指明新文件的访问权限O_TRUNC
:文件已存在,且是一个普通文件,打开文件是可写(即文件是用O_RDWR
或O_WRONLY
模式 打开 ),就把文件的长度设置为零 , 丢弃其中的现有内容
close(关闭文件)
close
关闭一个文件描述符,使它不在指向任何文件,并且可以在新的文操作中被再次使用
#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count);
- 返回值:返回0表示关闭成功,返回-1表示关闭时出错
fd
:文件描述符,open函数的返回值
read(读文件)
read
在文件描述符上执行读操作。
#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count);
read()
从文件描述符fd
中读取count字节的数据并放入从buf
开始的缓冲区中- 如果
count
为零,read()返回0,不执行其他任何操作 - 如果
count
大于SSIZE_MAX
,那么结果将不可预料 - 返回值:成功时返回读取到的字节数,发生错误时返回-1,并置
errno
为相应值
write(写文件)
write
在一个文件描述符上执行写操作
#include <unistd.h>
ssize_t write(int fd, const void *buf, size_t count);
- write向文件描述符
fd
所引用的文件中写入,从buf
开始的缓冲区中count
字节的数据。 - 返回值:成功时返回所写入的字节数(若为零则表示没有写入数据),错误时返回-1。
语言级IO(封装系统调用)
C语言文件操作函数接口 | 功能 |
---|---|
fopen | 打开文件 可以指定打开的方式 |
fputc | 向文件中写入一个字符 |
fputs | 向文件中写入一个字符串 |
fwrite | 向文件中写入指定数量的全部字符 |
fprintf | 以格式化的方式输入到文件中 |
fgetc | 从文件中读取一个字符 |
fgets | 从文件中读取n个字符(会读取\n) |
fread | 从文件中读取指定数量的全部字符 |
fscanf | 以格式化的方式读取文件中的数据 |
fseek | 将文件指针移动到 特定的偏移量的位置 |
ftell | 返回文件指针相对于起始的偏移量 |
rewind | 让文件指针回到起始的位置 |
fclose | 关闭文件 |
文件描述符
一个进程可以进行多个文件操作,所谓的“打开”文件,就是将文件的内容和属性加载到内存当中。
- 一个程序编译链接好后,会生成一个可执行程序,这时程序还没有被执行,在磁盘中还是一个普通的文件。
- 该程序运行时,会被加载到内存当中,然后程序的代码和数据被进程读取,进程会被加入到运行队列。
- 当被调度器调度时,会执行进程中程序的代码,这时就会执行相应的文件操作和其他代码。
文件描述符底层原理
打开文件时,是通过调用相关文件系统函数,fd
文件描述符是OS提供的返回值。
一个文件被打开,在内核中,要创建被打开文件的内核数据结构:
struct file
{
// 文件大部分内容和属性
// ....
struct file* next;
struct file* prev;
};
进程与被打开的文件建立映射关系:
- 文件被打开后,它的数据和属性会被加载到
struct file
中。 - 进程中包含一个
struct files_struct*
的结构体指针,该指针指向多文件的结构体(struct files_struct
)。 files_struct
里面包含了一个数组,该数组是一个结构体指针数组(struct file* fd[]
)。- 该数组里面存储着
struct file
的地址,该数组的下标就是fd
文件描述符。 - 文件被打开后,
struct file
会被分配到指针数组中为空的位置,然后OS会通过open
返回该位置的下标给用户,拿到文件描述符后,用户可以通过文件描述符来进行文件的读写操作。
每⼀个进程都有⼀个数据结构 task_struct
/struct file
,该结构体⾥有⼀个指向**「⽂件描述符数组」**的成员指针。该数组⾥列出这个进程打开的所有⽂件的⽂件描述符。
数组的下标是⽂件描述符,是⼀个整数,⽽数组的内容是⼀个指针,指向内核中所有打开的⽂件的列表,也就是说内核可以通过⽂件描述符找到对应打开的⽂件。
进程的task_struct
中有一个指向struct files_struct
结构体的指针,struct files_struct
中有一个数组array_fd[ ]
,该数组存储了该进程打开文件的struct file
结构体,所谓的文件描述符,其实是数组下标,进程可以通过数组下标,找到打开文件的结构体,struct file
里有文件的读写方法,就能够将进程的数据写到打开文件对于的磁盘文件,或者从磁盘文件读入到进程的数据中。
文件描述符的分配
文件描述符的分配规则:优先分配最小的、未分配的数组下标。一个进程默认会打开3个流,stdin
、stdout
、stderr
,分别对于0 1 2。
一般每个进程最多允许同时打开1024个文件,这1024个文件中还得除去每个进程必然打开的标准输入,标准输出,标准错误,服务器监听socket,进程间通讯的socket等文件,那么剩下的可用于客户端socket连接的文件数就只有大概1024-10=1014个左右。也就是说缺省情况下,基于Linux的通讯程序最多允许同时1014个TCP并发连接。
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <fcntl.h>
#include <sys/stat.h>
int main()
{
// 将该进程的文件全线掩码修改成0,给以后续代码最大权限
umask(0);
int fd1 = open("log.txt", O_WRONLY | O_TRUNC | O_CREAT, 0666);
int fd2 = open("log.txt", O_WRONLY | O_TRUNC | O_CREAT, 0666);
int fd3 = open("log.txt", O_WRONLY | O_TRUNC | O_CREAT, 0666);
if (fd1 < 0) printf("fd1");
if (fd2 < 0) printf("fd2");
if (fd3 < 0) printf("fd3");
printf("fd1: %d\n", fd1);
printf("fd2: %d\n", fd2);
printf("fd3: %d\n", fd3);
return 0;
}
因为程序运行时,会默认打开三个流:stdin
& stdout
& stderr
:
- 0号描述符:标准输入流,键盘
- 1号描述符:标准输出流,显示器
- 2号描述符:标准错误流,显示器
#include <stdio.h>
extern FILE* stdin;
extern FILE* stdout;
extern FILE* stderr;
- FILE*是一个文件指针
- FILE是C库提供的结构体,它封装了很多成员,其中包含了
fd
"文件描述符" - C库函数调用文件相关系统接口,必须通过
fd
文件描述符符来实现
// 打印标准输入输出错误流的文件描述符
int main()
{
// 验证012和stdin,stdout,stderr的对应关系
printf("stdin: %d\n", stdin->_fileno);
printf("stdout: %d\n", stdout->_fileno);
printf("stderr: %d\n", stderr->_fileno);
return 0;
}
stdin: 0
stdout: 1
stderr: 2