文件的I/O操作有两种方式:一是,利用系统调用;另外一种方法是利用C语言提供的标准I/O库。 在UNIX系统调用函数中常用于文件I/O的函数主要有五个,open,read,write,lseek,close。这种方式又称为不带缓冲的文件I/O。而C语言标准库提供的函数如fopen,fputc等则称为带缓冲的文件I/O。
那么如何理解什么叫带缓冲的文件I/O呢?带与不带缓冲有什么区别?
首先需要指出的是,在操作系统中进行文件I/O时,都会在内存分配一块空间,我们称做高速缓存,当将数据写到文件上时,内核先将该数据写到缓存,如果该缓存未满,则并不将其排入输出队列,直到缓存写满或者内核再次需要重新使用此缓存时才将其排入输入队列,待其到达对首,在进行实际的I/O操作,也就是此时才把数据真正写到磁盘,这种技术叫延迟写。从文件读数据也是同样道理。这样就有利于提高I/O效率,因为内存速度要远快于磁盘读写速度嘛。那么,所谓带缓冲文件I/O中的缓冲是不是指的就是这个高速缓冲呢?
显然不是。
上面提到的高速缓冲实际上是在内核空间里面的,而带缓冲文件I/O中的缓冲是指用户空间中的缓冲。
需要说明的是标准I/O的底层实现最终还是要调用系统函数,只不过在用户进程空间设立了缓冲之后,不用每次都调用系统函数,可以减少对系统函数的调用。
另外, fflush将流所有未写的数据送入(刷新)到内核(内核缓冲区),fsync将所有内核缓冲区的数据写到文件(磁盘)。