1、为什么要使用文件
首先我们要了解,我们要想长久的保存数据。,就需要一个东西来替我们保存,这时候就需要文件来保存。
2、什么是文件
磁盘(硬盘)上的文件是文件
但是在程序设计中,我们一般只谈两种文件:程序文件、数据文件。
2.1、程序文件
程序文件包括源文件程序(以.c作为后缀的文件),目标文件(在Windows环境后缀为.obj),可执行程序(Windows环境下后缀为.exe的)。
2.2、数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
而我们所了解的数据文件,在以前我们通常都是在键盘里面输入数据,运行结果显示在显示屏上。
其实有时我们会把信息输入到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘文件。
2.3、文件名
一般文件要用一个文件标识,以便用户识别和引用
文件名有三个部分组成
文件名 = 文件路径+文件名主干+文件后缀。
为了方便起见,文件标识常被称为文件名。
3、二进制文件和文本文件
数据文件又分为二进制文件和文本文件
数据在内存中存储是以二进制的形式存储的,如果不进行转换输出到外存的文件中,就是二进制文件。
如果要求在外存上以ASCII码来存储,则需要在存储前进行转换。以ASCII字符的形式存储的文件就是文本文件
4、文件的打开和关闭
4.1、流和标准流
4.1.1流
我们程序日常都需要输出到外部设备,也需要从外部设备中获取数据,方式各不相同,为了方便操作,我们抽象出了流这种概念。
c语言中的文件,画面,输入输出操作都是需要先打开流然后再进行操作。
4.1.2标准流
c语言在程序启动时默认打开了三个流:
stdin-标准输入流,在大多数的环境中从键盘中输入,scanf函数就是从标准输入流中读取数据。
stdout-标准输出流,大多数环境中输出至显示器界面,printf函数就是将信息输出到标准输出流中。
stderr-标准错误流,大多数环境下输出到显示器上。
stdin、stdout、stderr这三个流的类型我们统称为:FILE *,通常被成为文件指针。
c语言中就是通过FILE *的文件指针来维护流的各种文件操作。
4.2文件指针
在缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”.
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的信息(如文件名,文件类型等)。这些文件都被保存在一个结构体变量当中。该结构体类型由系统声明的,取名为FILE.
我们通常可以这样创建指针变量
FILE*pf
这样就可以创建一个文件指针变量pf了,pf是指向类型为FILE类型的数据的指针变量。也就是指向我们所说的文件信息区。所以我们可以通过文件指针变量来找到与它相关联的文件。
4.3、文件的打开与关闭
文件在读写前就应该先打开文件,使用结束后关闭文件
我们通常在编写程序时,打开文件都会返回一个FILE*类型的指针变量指向该文件,也就与该文件产生了联系。
ANSI C规定使用fopen来打开文件,fclose来关闭文件。
我们可以看到fopen会返回一个FILE*类型的文件指针类型变量
而fclose返回值则是int类型。
接下来我们先看fopen第一个参数是filename,也就是文件名,而第二个参数是mode,是打开方式,我们来看看fopen打开方式有多少种吧。
- r 以只读方式打开文件,该文件必须存在。
- r+ 以可读写方式打开文件,该文件必须存在。
- rb+ 读写打开一个二进制文件,允许读数据。
- rw+ 读写打开一个文本文件,允许读和写。
- w 打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。
- w+ 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。
- a 以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。(EOF符保留)
- a+ 以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。 (原来的EOF符不保留)
这是我们通常所使用的几种。
5、文件的顺序读写
5.1顺序读写函数
我们通常对文件操作时,会使用到上面的函数。
6、文件的随机读写
6.1、fseek
简单来说就是对文件内容的光标进行定位
我们先看它的参数有,stream,文件流,offset,还有origin,这三个参数,第一个是文件指针,第二个是光标移动的位置,还有一个就是起始的位置。
ok了,我们运行了这个程序之后就出现了一个test1文件,我们先写了"this is test1"当我们把光标定位在字符串末尾后,在往后移10个字符的位置,再次输入"test is test2",这就是文件的光标定位。
6.2、ftell
让文件指针的位置返回文件的起始位置
我们可以看到参数只有一个就是stream也就是文件指针,它的返回值是long int,也就是返回文件光标距离文件初始的位置
经过上面的fseek,我们已经创建了test1.txt,接下来我们来通过fseek将文件光标移动到文件内容末尾,再经过fseek来测量距离初始位置的距离,经结果可知为36.
6.3、rewind
让文件的位置返回到初始的位置
我们写段代码来了解一下吧。
这里我们可以看到这里先是创建了一个文件名为test2.txt,然后通过fputc函数去进行写文件,写完文件之后,文件光标应该置于文件末尾,然后我们通过rewind函数去进行初始文件光标位置,最后通过fread函数将p2的文件内容读写到arr数组里面,如果不进行rewind的初始化,那么文件光标在末尾就进行不了读写了。
7、文件读取结束的判定
7.1、不要错误的使用feof
可以看出这两个函数的参数是一样的,返回类型也是一样的,但是使用方法确实不一样的
在读取的时候不要用feof来判读是否读取结束
feof的作用是:当文件结束之后,判断是读取结束的原因是否是遇到文件尾结束。
ferror的作用是:如果设置了与流关联的错误标识符,该函数返回一个非零值,否则返回一个零值。
文本文件读取时,我们通常用fgetc函数以及fgets函数,fgetc函数判断返回值是否为EOF,fgets函数判断返回值是否为NULL。
该段代码我们可以看出我们我们是用读的方式打开文件,却用fputc函数区写文件,这是错误的,这下面feof就是用来判断结束的原因是否是遇到文件尾结束,如果不是则返回一个零,接下来及时用ferror来判断是否出了一个错误,如果出了错误,则返回一个非零值。
8、文件缓冲区
ANSIC标准采用"文件缓冲区"来处理数据文件的,所谓的文件缓冲区就是当内存向磁盘输入数据时,数据会先被输入进文件缓冲区,待装满缓冲区之后一起送入磁盘中。