1、文件IO简单来说无非就是打开文件、读、写文件罢了,unix系统中基本都提供5个函数:open、read、write、lseek以及close。
2、什么叫不带缓冲的的IO,书上说:指的是每个read和write都调用内核中的一个系统调用。目前还不懂这条
3、文件描述符:一个非负整数,一般0、1、2这三个已经被默认为标准输入、标准输出和标准错误。
4、函数open和opena函数原型如下:
#include <fcntl.h>
int open(const char* path, int oflag,...);
int openat(int fd, const char* path, int oflag, ...);
由open和openat返回的文件描述符一定是最小的未用描述符数值。
fd参数区分两个函数:
若path指定绝对路径名,则fd被忽略,两个函数作用一样
若path指定相对路径名,则fd指出了相对路径名在文件系统中的开始位置。fd参数是通过打开相对路径名所在的目录来获取的。
5、函数creat,创建一个新文件
#include <fcntl.h>
int creat((const char* path, int oflag);
6、函数close,关闭一个打开的文件
#include<unistd.h>
int close(int fd);
当一个进程终止时,内核会自动关闭它所有打开的文件,并且释放该进程加在文件上的所有记录锁,因此有时不必显示调用close。
7、函数lseek
#include<unistd.h>
off_t lseek(int fd, off_t offset, int whence);
参数whence指定从哪个位置进行偏移
SEEK_SET 从开始处进行偏移
SEEK_CUR 从当前位置进行偏移
SEEK_END 从最后面进行偏移
偏移量可以大于文件当前长度,此时会造成空洞,文件的空洞并不要求在磁盘上占用存储区。具体处理方式与文件系统的实现有关,当定位到超出文件尾端之后写时,对于新写的数据需要分配磁盘块,但是对于原文件尾端和新开始写位置之间的部分不需要分配磁盘块。
8、函数read
#include < unistd.h>
ssize_t read(int fd, void* buf, size_t nbytes);
9、函数write
#include < unistd.h>
ssize_t write(int fd, void* buf, size_t nbytes);
10、简单的文件复制
int main(void)
{
int n;
char buf[4098];
while((n = read(0, buf, 4098)) > 0)
if(write(1, buf, n) != n)
printf("write error");
if(n < 0)
printf("read error");
return 0;
}
11、文件共享
unix系统支持在不同进程间共享打开的文件。
3种数据结构:
每个进程都有一张打开文件描述符表
内核为所有打开文件维持一张文件表
每个打开的文件都有一个v节点结构
如下图:
如果两个独立进程各自打开同一文件
我们可以看到lseek只修改当前文件表项中的文件偏移量,不进行io操作
12、函数dup和dup2
复制一个文件描述符
int dup(int fd);
int dup2(int fd1, int fd2);
dup返回新文件描述符一定是当前可用文件描述符中最小的数值,对于dup2,可以用fd2参数指定新描述符的值,如果fd2已经打开,则先将其关闭。
复制一个文件描述符使用dup函数或者fcntl函数
dup(fd);等效于 fcntl(fd,F_DUPFD, 0)
调用dup2函数
dup2(fd1,fd2);等效于 close(fd2);fcntl(fd1,F_DUPFD, fd2);
但是dup和dup2是一个原子操作
13、函数sync、fsync和fdatasync
将缓冲区的数据写回磁盘中
int fsync(int fd);
int fdatasync(int fd);
void sync(void);
sync只是将所有修改过的块缓冲区排入写队列,然后就返回,不等待实际全部完全写回磁盘中。
fsync只对文件描述符fd一个文件起作用,并且等待其写完才返回。
fdatasync类似fsync,但它只是影响文件的数据部分,除数据外,fsync还会同步更新文件的属性。
14、函数fcntl
改变已经打开的文件属性,这个以后再写