三、标准I/O函数库
C标准库提供了文件的标准 I/O函数库,相比前述的系统调用,主要差别是实现了跨平台的用户态缓冲的解决方案。标准I/O库使用简单,与系统调用I/O相似,也包括打开、读写、关闭这些操作。
系统调用是操作系统直接提供的函数接口。因为运行系统调用时,Linux必须从用户态切换到内核态,执行相应的请求,然后再返回到用户态,所以应该尽量减少系统调用的次数,从而提高程序的效率。
1、文件指针和流
系统级的I/O操作函数都是针对文件描述符的。即打开文件时返回一个文件描述符,然后可以直接对该文件描述符进行操作。
对于标准I/O操作函数来说,打开或创建一个文件时,会返回一个指向FILE对象的指针。该FILE对象通常是一个结构体,它包含了I/O函数库为管理该FILE对象所需要的尽可能多的信息。包括用于实际I/O文件的文件描述符,指向流缓存的指针,缓存长度等。
文件指针与文件描述符是一一对应的关系,这种对应关系由标准I/O库自己内部维护。应用程序调用时,只需要提供文件指针即可。文件指针指向的数据类型为FILE型,但应用程序无须关系它的具体内容。
在标准I/O中,一个打开的文件称为流(stream),流可以用于读(输入流)、写(输出流)或者是读写(输入输出流)。每个进程在启动后就会打开三个流,与打开的三个文件相对应:stdin代表标准输入流,stdout代表标准输出流,stderr代表标准错误输出流(与地层文件描述符0,1和2相对应),它们都是(FILE*)型的指针。标准错误输出流不进行缓冲,输出的内容会马上同步到文件(控制台设备)。
2、标准 I/O编程
2.1、打开和关闭流
fopen函数用于打开一个文件流,其原型如下:
◆FILE *fopen(const char *filename, const char *mode);
filename:被打开的文件的名称(可包含路径)。
mode:字符串,用于表示打开的模式。
返回值:打开成功后的文件指针,失败则返回NULL。
mode如下:(此参数是一个字符串,而不是一个字符,所以应该使用双引号)
字符串 含义
“r” 或 “rb” 以只读方式打开
“w” 或 “wb” 以只写方式打开,若文件有内容,则清空
“a” 或 “ab” 以只写方式打开,原内容保留,写入的内容附加在文件流尾部
“r+” 或 “rb+ "或 "r+b" 以更新方式打开,此时文件可读可写
“w+” 或 wb+ 或"w+b " 以更新方式打开,文件可读可写,但打开时清空文件内容
“a+” 或 "ab+ "或 "a+b " 以更新方式打开,文件可读可写,写入的内容附加在文件流尾部
字母b表示文件是一个二进制文件,而不是一个文本文件。
fclose 函数用于关闭文件,其原型如下:
◆int fclose(FILE *stream);
这个函数可以改变 stream参数所代表的文件,如果改变成功则返回 0,否则将返回 EOF 并且设置变量errno 的值以指示错误。
改变前会自动将文件流中的数据写入文件。
2.2、读和写流
一旦打开了流,则可以在三种不同类型的非格式化I/O中进行选择,对其进行读写操作:
(1).每次一个字符的I/O
(2).每次一行的I/O
(3).数据块I/O,数据块I/O操作读或写一定数量的对象,而每个对象具有指定的长度。fread, fwrite函数常用于每次读或写一个结构。
2.3、每次一个字符的I/O
字符输出函数:
◆int fgetc(FILE *stream);
◆int getc(FILE *stream);
◆int getchar(void);
fgetc 函数用于从文件流中读取一个字符,与它功能相同的函数时 getc,其中 stream 参数是要读取的文件流。它们返回值虽然是整型,但实际表示的是读到的字符,只不过进行了类型转换。如果读操作发送错误或者到达文件尾,则返回值是 EOF。
getc 与 fgetc 的区别在于它可能是由宏定义实现的,因此参数可能在宏展开以后被使用多长,如果参数本身是一个表达式就会被多长求值,这种情况在使用中应该避免。
getchar 函数用于从标准输入流读取一个字符,实际上对 getchar的调用完成等价于getc(stdin),它从标准输入里读取下一个字符。
字符输入函数:
◆int putc(int c, FILE * stream) ;
◆int fputc(int c, FILE * stream) ;
◆int putchar(int c) ;
fputc 函数用于向文件流写入一个字符,其原型如下:putc函数与它的功能相同:
c:是要写入的字符,它虽然是整型,但写入时会将其转换为无符号字符型。
stream:要写入的文件指针。
返回值:写入的字符转换成整型后的值,发送错误则返回EOF。
putc 函数与fputc函数的区别在于它有可能是用宏定义实现的。
putchar 用于向标准输出写入一个字符,与putc等同:
putc(c,stdout),把单个字符写到标准输出。
2.4、每次一行的I/O
行输出函数:
◆char * gets(char *s)
◆char fgets(char * s, int size, FILE * stream)
fgets 用于从文件流中读取一行数据:
s:指向一个缓冲区,用于存放读到的数据。
size:读取的字节数上限,实际读取的字节数不会超过 size-1。
stream:要读取的文件指针。
返回值:等于 s,如果有错误发生或文件结束,则返回 NULL。
用 fgets函数读取数据时,当读到一个换行符,或者文件结束,或者读取的字节数达到 size-1,则读取操作不再继续,函数返回。fgets 函数还会在读到的数据最后加一个字符 \0,使之变成一个合法的字符串。注意,如果读到换行符,则换行符也在读到数据中。
gets 函数用于从标准输入读取一行数据,参数 s指向用于存放数据的缓冲区,如果读取成功则返回值就是s,否则返回 NULL。
gets 是一个不提倡使用的函数,因为它对读入的字节数没有控制,缓冲区是否会溢出完全取决于用户的输入。
行输入函数:
◆ int fputs(const char *str, FILE *fp)
◆int puts(const char *str)
fputs 函数用于向文件流写入一个字符串,其原型如下:
s:要写入的字符串,必须是以 \0结尾的合法字符串。
stream:要写入的文件指针。
返回值:非负数表示写入成功,有错误发生则返回 EOF。
fputs 函数在向文件流写入字符串时,字符串的结束符 \0并不会被写入。
puts 函数将字符串写入标准输出, 其中 s参数是要写入的字符串,它的返回值的含义与 fputs 函数相同。
与 fputs 函数不同的是,puts 函数在将字符串写入之后会再写入一个换行符。
2.5、数据块I/O
◆size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream)
fread函数用于从打开的文件流中读数据:
ptr:指向用于存放读取到的数据的缓冲区。
size:被读取的数据块的长度。
nitems:要读取的数据块的个数。
stream:被读取的文件指针。
返回值:实际读取到的数据块的个数。
使用 fread函数需要注意的是,它以数据块(或称记录)为单位进行读取,返回值也是成功读取的数据块的个数,而不是字节数,这个数目有可能比要读取的个数 nitems 少。
◆size_t fwrite(const void * ptr,size_t size, size_t nmemb, FILE * stream)
fwrite 函数用于向打开的文件流写入数据:
ptr:指向存放写入数据的缓冲区。
size:要写入的数据块的长度。
nitems:要写入的数据块的个数。
stream:要写入的文件指针。
返回值:实际写入的数据块的个数。
与 fread函数类似,fwrite 函数也是数据块为单位向文件流写入数据的。
2.6、格式化输出
fprintf 是向文件流格式化写入数据的函数,其原型如下:
◆int fprintf(FILE *stream, const char *format,...);
stream:要写入的文件指针。
format:格式字符串。
可变参数:要写入的数据。
返回值:如果写入成功,则返回格式化后字符串的长度,也就是写入数据的长度,负数表示有错误发生。
常用输出转换符:
格式符 功能
%d 或 %i 按有符号十进制格式输出整型参数
%u 按无符号十进制格式输出无符号整型参数
%o 按无符号八进制格式输出无符号整型参数
%x 按无符号十六进制格式输出无符号整型参数,使用字母 a,b,c,d,e,f
%X 按无符号十六进制方式输出无符号整型参数,使用字母 A,B,C,D,E,F
%c 将整型参数转换为无符号字符型,并输出为字符
%f 按十进制格式输出高精度浮点型参数
%e 按科学计数法格式输出高精度浮点型参数,使用字母 e
%E 按科学计数法格式输出高精度浮点型参数,使用字母 E
%g 或 %G 可理解为系统自带选择 %f 或 %e 格式输出
%p 按十六进制格式输出指针型参数
%s 将字符指针型参数视为字符串输出
因为格式字符串中的符号 %有了特殊的含义,所以要原样输出一个 %,则需要连续写两个 %,即 %%。
常用输出格式符标志(放在 %的后面):
字符 作用
数字 0 当输出数字时,填充 0 而不是空格
减号 - 修改为左对齐方式,空格填充在右边
空格 对应正数来说,左边预留一个空格作为符号位
加号 + 总是在正数左边加上 + 符号,在负数左边加上 - 符号
我们常用的 printf 函数实际上是对 fprintf 函数的包装,它用来向标准输出写入格式的字符串,其原型如下:
◆int printf(const char *format, ...);
它比 fprintf函数少一个文件指针参数,因为这个文件指针一定是 stdout。
与格式化输出相关的还有一个函数 sprintf,它并不是文件 I/O 操作,而是将格式化的字符串输出到一个缓冲区中,原型:
◆int sprintf(char *str, const char *format,...);
其中 str参数就指向用于存放结果的缓冲区。sprintf 函数会在输出字符串的末尾加上结束符 \0。使用这个函数时要注意,str
指向的缓冲区要有足够的大小来容纳生成的字符串,否则就有内存访问越界的问题。很多情况下并不能事先知道结果字符串的长度,这时可
以用下面这个函数:
◆int snprintf(char *str, size_t size, constchar *format, ...);
size:限制生成字符串的长度,即写入缓冲区的字节数。如果格式化后的字符串长度等于或大于 size,则只写入前 size-1个字节,然后写入结束符 \0。
返回值:格式化后的字符串长度。
2.7、格式化输入函数
fscanf 可以从文件流以一定的格式读取数据,其原型如下:
◆int fscanf(FILE *stream, const char *format, ...);
stream:要读取的文件指针。
format:格式字符串。
可变参数:一般是指针,指向用于存储到的数据流量。
返回值:成功解析的数据项的个数(不是字节数),失败则返回 EOF。
格式字符串中的字符将与输入流中读到的字符进行匹配,具体来说有以下几种情况。
空白字符:包括空格、制表、换行等字符,将与输入流中的连续 0个或多个空白字符相匹配,也就是说,一个空白字符可以消 耗多个空白字符。
普通字符:不想与从输入流读入的字符相同。
转换符:以符合 %开始的多个字符,这时输入流中读入的字符将按某种格式解析为数据,存入对应的可变参数指向的变量中。
常用输入转换符:
转换符 作用
%d 以十进制格式读入整数,存在整型变量中
%i 当下一个字符是 0时,以八进制格式读取整数;当下两个字符是 0x 或 0X 时,以十六进制格式读入整数;否则以十进制格式读入整数,存放在整型变量中。
%u 以十进制格式读入整数,存放在无符号整型变量中
%o 以八进制格式读入整数,存放在无符号整型变量中
%x 或 %X 以十六进制格式读入整数,存放在无符号整型变量中
%f,%g,%e 或 %E 读入浮点数,存放在浮点型变量中
%s 读入字符串,字符串从下一个非空白字符开始,再遇到一个空白字符或者达到指定的域宽后结束。字符串存放在对应的参数指向的缓冲区中,末尾会自动加上 \0
%c 读入域宽所指定个数的字符,默认是一个。不跳过开始的空白字符,读入的字符放在对应参数指向的字符数组中,末尾不加 \0
scanf 函数类似于 fscnaf函数,只不过是从标准输入读取数据,原型:
◆int scanf(const char *format, ...);
还有一个 sscanf 函数可以从字符串中格式化读取数据,原型:
◆ int sscanf(const char *str, const char*format, ...);
其中,str参数就是被读取的字符串
2.7、定位流
fseek函数的功能是把当前位置设置到offset处,whence参数决定了相对于文件的位置,其原型如下:
◆int fseek(FILE *stream, long offset, int whence);
stream:被操作的文件指针。
offset:读写位置的偏移量。
whence:用于指定偏移量的相对启点。
返回值:0 表示操作成功, -1 表示操作失败并且设置 errno 变量的值为错误码。
whence 参数的取值及含义:
SEEK_SET:表示偏移量相对于文件的开头。
SEEK_CUR:表示偏移量相对于当前的读写位置。
SEEK_END:表示偏移量相对于文件末尾。
如果要将读写位置移动到文件的开头,还可以使用这个函数:
◆void rewind(FILE *stream);
ftell 函数可以得到文件流的读写位置,其原型:
◆long ftell(FILE *stream);
参数 stream 是文件指针,返回值就是文件流的当前读写位置(相对于文件开头)。
2.8、标准 I/O 错误处理:
当标准 I/O 操作发送错误时,比如返回 NULL 指针或者 EOF,可以通过读 errno 变量得到错误码。
更方便的是使用标准 I/O 的错误判断函数,如:
◆int ferror(FILE *stream);
◆int feof(FILE *stream);
ferror函数检查文件在用各种输入输出函数进行读写时是否出错。返回0表示没有错,否则有错。
feof函数判断文件是否处于文件结束位置,如文件结束返回1,否则返回0。