目录
前言
C语言原生的对于文件的操作是相对较少的,一般是在它上面再封装一层函数,使其使用起来更方便简单。
1. 为什么使用文件
在通讯录的程序中,当通讯录运行起来的时候,可以给通讯录中增加、删除数据,此时数据是存放在内存中,打印的数据也是内存中的数据。当程序退出的时候,通讯录中的数据自然就不存在了,等下次运行通讯录程序的时候,数据又要重新录入,如果使用这样的通讯录就很难受。我们在想既然是通讯录就应该把信息记录下来,只有我们自己选择删除数据的时候,数据才不复存在。
这就涉及到了数据持久化的问题,一般数据持久化的方法有:把数据存放在磁盘文件、存放到数据库等方式。使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化。
2. 什么是文件
磁盘(是C盘,也称硬盘)上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。
2.1 程序文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
.bat也是程序文件,只要与程序有关的,写代码完成的都可以认为是程序文件。后缀为.c的是C语言的程序文件,当对程序文件进行编译(生成解决方案)的时候,是编译链接操作,此时在后台就会生成Debug文件夹,在Debug文件夹中可以看到后缀为.exe的文件,这是编译所产生的可执行程序,这个可执行程序也是程序文件;在Debug文件夹中还可以看到.obj的文件,是目标文件,是程序在编译过程中生成的临时文件,把目标文件经过链接就会生成.exe的可执行程序。
2.2 数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,
或者输出内容的文件。
程序文件和数据文件的关系:
在test.c中写C语言代码,若通过C语言文件去操作(通过程序把数据写到date.txt文件中,把数据123456789写到date.txt文件中,test.c中放的是代码,是程序文件,通过test.c去操作date.txt文件——向date.txt文件中写数据123456789,当然可以从date.txt中拿走或读取数据123456789,此时操作的date.txt就是数据文件。操作的文件名叫test2.c也可以,向test2.c中写数据和读或拿数据,此时test2.c也是数据文件。
本篇博文讨论的是数据文件——如何通过代码来操作数据文件。
在之前博文所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
意思是写test.c这样的代码,其实是从键盘上获取数据(键盘读的数据放到程序中),当程序想输出的时候则打印数据在显示器上,此时操作的对象是键盘和显示器。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上的文件。
2.3 文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀。
例如文件名:c:\code\test.txt
意思是c盘的code目录下test.txt文件,c:\code\是文件路径,test是文件主干名,.txt是文件后缀。
为了方便起见,文件标识常被称为文件名。
3. 实现文件的打开和关闭
对文件进行操作就涉及文件的打开和关闭,在文件中写数据或从文件中哪数据需要打开文件去使用,使用完之后关闭。
3.1 文件指针
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE。
当程序去操作一个文件如data.txt的时候:
参考VS2013编译环境提供的<stdio.h>头文件中有以下的文件类型申明:
struct _iobuf {
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并自动填充其中的信息,所以使用者不必关心细节。一般都是通过一个FILE类型的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面我们可以创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。
比如: