一、什么是文件
磁盘(硬盘)上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。
1、程序文件
程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
2、数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。本次讨论的是数据文件。
3、文件名
一个文件要有唯一一个文件标识,以便用户识别和引用。
文件名包含三部分:文件路径+文件名主干+文件后缀 例如:D:\code\xxx.txt
二、二进制文件和文本文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存的文件中,就是二进制文件。如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在文件中储存:
字符一律以ASCII码值的形式储存,数据型数据既可以用ASCII码的形式储存,也可以使用二进制形式储存。
三、文件的打开和关闭
1、流和标准流
流 :
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输入输出操作各不相同,为了方便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。
C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。
一般情况下,我们要想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。
标准流:
那为什么我们从键盘输入数据,向屏幕上输出数据,并没有打开流呢?
那是因为C语言程序在启动的时候,默认打开了3个流;
* stdin-标准输入流,在大多数的环境中从键盘输入,scanf函数就是从标准输入流中读取数据。 *stdout-标准输出流,大多数的环境中输出至显示器界面,printf函数就是将信息输出到标准输出流 中。
* stderr-标准错误流,大多数环境中输出到显示器界面。
这是默认打开了这三个流,我们使用scanf、printf等函数就可以直接进行输入输出操作的。stdin、stdout、stderr三个流的类型是:FILE*,通常称为文件指针。
C语言中,就是通过FILE*的文件指针来维护流的各种操作的。
2、文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息,这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名FILE.
在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,相当于建立指针和文件的关系,
3、文件的打开和关闭
打开文件:
FILE* fopen(const char*filename,const char*mode);
规定用fopen函数打开文件,其中filename是文件名,mode是文件打开模式。
关闭文件:
int fclose(FILE*stream);
使用文件结束后应该关闭文件。
在编写程序需要打开文件时,为避免文件不存在,可以使用perror
例如
四、文件的顺序读写
1、顺序读写函数
函数名 | 功能 | 适用于 |
fgetc | 字符输入函数 | 所有输入流 |
fputc | 字符输出函数 | 所有输出流 |
fgets | 文本行输入函数 | 所有输入流 |
fputs | 文本行输出函数 | 所有输出流 |
fscanf | 格式化输入函数 | 所有输入流 |
fprintf | 格式化输出函数 | 所有输出流 |
fread | 二进制输入 | 文件 |
fwrite | 二进制输出 | 文件 |
对比:
printf/fprintf/sprintf
fprintf:把数据以格式化的形式打印在指定的输出流上
sprintf:把格式化的数据转换成字符串
五、文件的随机读写
1、fseek
根据文件指针的偏移量和位置来定位文件指针。
int fseek(FILE* stream, long intoffset int origin);
其中offest是偏移量,origin是起始位置。
起始位置:
①SEEK_SET 文件起始位置
②SEEK_CUR 文件指针当前位置
③SEEK_END 文件末尾
偏移量可以是负数,往回偏移。
2、ftell
返回文件指针对于起始位置的偏移量。
long int ftell(FILE*stream);
3、rewind
让文件指针的位置回到文件的起始位置。
void rewind(FILE*stream);
六、文件读取结束的判定
打开一个流的时候,这个流上有2个标记值:
1、是否遇到文件末尾 2.是否发生错误
1、被错误使用的feof
牢记:在文件读取过程中,不能用feof函数的返回值直接来判断文件的是否结束。
feof 的作用是:当文件读取结束的时候,判断是读取结束的原团是否是:遇到文件尾结束。
2.文本文件读取是否结束
判断返回值是否为EOF (fgetc),或者 NULL fgets)
例如:
*fgetc判断是否为EOF. (遇到文件末尾,或者发生错误 ,返回EOF)
如果读取正常.返回的是读取到字符的ASCII码值。
fgets 判断返回值是否为NULL.
如果读取正常,返回的是储存到的字符串的字符数组的地址。
2.二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
七、文件缓冲区
ANSIC标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
因为有缓冲区的存在,c语言在操作文件的时候,需要做缓冲区或者在文件操作结束的时候关闭文件。