本次内容主要包括文件的打开和关闭,文件的顺序读写,随机读写,文本文件和二进制文件,文件读取结束的判定和文件缓冲区,这节的内容非常简单,面试相关的东西也不多。
一.文件概述
1.文件分为程序文件和数据文件。
程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境 后缀为.exe)。
数据文件是文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件, 或者输出内容的文件。
本文探讨数据文件。
二.文件的打开和关闭
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE。
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息, 使用者不必关心细节。
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。
那么文件的打开和关闭是如何执行的呢?
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。 在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
这个代码具体给出如何打开和关闭一个文件,这里需要注意的是:打开文件的时候,务必记得判断pf是否为空,并用perror返回错误信息(如果为空)
一般情况下,我们针对于fopen中第二个参数mode,给出以下模式:
三.文件的顺序读写
既然已经打开了文件,那么下一步肯定是读写文件,
这里针对以下几个函数举例子:fputc,fgetc,fputs,fgets,fprintf,fscanf,sprintf,sscanf,fwrite和fread。
1.fputc,这个函数叫字符输出函数,作用是向文件中写入数据,适用于所有输出流
c是需要写入的参数,stream是待写入流
2.fgetc,这个函数叫字符输入函数,作用是从文件中读取数据,适用于所有输入流
这就是从上面刚写的文件中读出来的内容,这里要注意,fgetc读取结束(失败)后返回EOF
3.fputs,这个是文本行输出函数,和fputc差不多
4.fgets,文本行输入函数
这是从上面的文件中内容向arr中写入数据,这里注意的是\0也会被写入,所以一定要字符数-1,而且写入的时候是从第一个字符开始写,pf是源,arr是接受内容
5.fprintf
6.fscanf
注意:在读取age和double的时候别忘了取地址,输出也有两种方式,一种是直接printf,另一种是用fprintf打印到屏幕上
7.sscanf和sprintf
这两个函数通过一段代码来解释
8.fwrite,二进制写
向stream中写数据
9.fread 二进制读
从 stream中读数据
四.文件的随机读写
1.fseek:根据文件指针的位置和偏移量来定位文件指针。偏移后用printf即可打印出指针指向的内容。非常简单。
2.ftell和rewind,当rewind不注释时,3会改为0
五.文本文件和二进制文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。 数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。 如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢? 字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而 二进制形式输出,则在磁盘上只占4个字节。
六.文件读取结束的判定
这里其实就一点::在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。 而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
1. 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如: fgetc 判断是否为 EOF .
fgets 判断返回值是否为 NULL .
2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如: fread判断返回值是否小于实际要读的个数。
七.文件缓冲区
这块就更简单了
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序 中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装 满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓 冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根 据C编译系统决定的。
因为有缓冲区的存在,C语言在操作文件的时候,需要刷新缓冲区。 如果不刷新,可能导致读写文件的问题。
写的比较乱....