在程序中,对于文件的读写,程序运行时间主要消耗在I/O上。与读写内存相比,读写硬盘上的文件慢很多;每次读取/写入文件的内容很少的话,那么程序运行时间主要消耗在I/O上了。因此有了缓冲I/O和非缓冲I/O。
非缓冲I/O,每次对于文件的操作,都要进行I/O操作。例如Linux的系统条用:
open, read, write, lseek, close。
它们依赖操作系统,没有文件结构体指针(把文件当做二进制文件),直接对文件进行操作,这些操作没有经过缓冲区。例如写一个文件write,直接把内容写到物理磁盘上了。优点是能迅速把内容写到文件中,在遇到突发事件时(例如断电),内容不会丢失。缺点就是频繁进行I/O操作,非常消耗CPU。
fopen, fclose, fread, fwrite, fgetc, fgets, fputc, fputs, freopen, fseek, ftell, rewind
缓冲I/O,就是在内存中开辟了一块缓冲区,对文件的操作先存在了缓冲区,在“需要”的时候在写到磁盘。一般来说,缓冲区越大,进行实际I/O就越少,效率越高。
它们依赖文件结构体指针,可以读写字符、字符串、格式化数据。
标准I/O的函数就是缓冲的I/O操作:
缓冲I/O有全缓冲和行缓冲:
全缓冲是在缓冲区填满后才进行实际的I/O操作。在磁盘上的文件常常由标准I/O库函数实施全缓冲。
行缓冲是指在输入或输出中遇到换行符时,执行实际的I/O操作。
区别:
fopen系列函数是标准库提供的,使用的是文件结构体指针,把文件当做流来处理。
open系列函数是系统条用,使用的是文件描述符。
在Linux一切皆文件,但是fopen操作的只是指普通文件。设备文件不能当做流式文件来处理的,只能使用open系列函数。
fopen使进程在用户态下就有了缓冲区,不像open系列函数,每次都要进行系统条用,用户态/内核态切换。