【C语言】文件操作（超级详细）

最新推荐文章于 2024-06-14 10:22:04 发布

☆璇

最新推荐文章于 2024-06-14 10:22:04 发布

阅读量981

点赞数 20

分类专栏： C语言知识讲解文章标签： c语言开发语言其他

本文链接：https://blog.csdn.net/2401_82759674/article/details/138534820

版权

C语言知识讲解专栏收录该内容

15 篇文章 1 订阅

订阅专栏

如果没有文件，我们写的程序的数据都存储在内存中，当程序退出，内存回收，数据就丢失了，下次再运行程序，已经看不到上次运行的数据了，而为了将数据持久性的保存，就需要使用文件。

一、什么是文件

磁盘（硬盘）上的文件就是文件。

但是在程序设计中，我们一般谈论两种文件：程序文件，数据文件（从文件功能的角度来分类）。

1.1 程序文件

程序文件包括源程序文件（后缀为.c），目标文件（windows环境后缀为.obj），可执行程序（windows环境后缀为.exe）。

1.2 数据文件

文件的内容除了可以是程序，还可以是程序运行时读写的数据，比如程序运行时需要从中读取数据的文件，或者输出内容的文件。

本篇博客谈论的数据文件。

在以前我们程序所处理数据的输入输出都是以终端为对象，即从终端的键盘输入数据，运行结果显示在显示屏上。

但是我们也可以将数据输出到磁盘上，当需要时再从磁盘上将数据读取到内存中使用，这里处理的就是磁盘中的文件。

1.3 文件名

每一个文件都有一个独属于自己的文件标识，方便用户识别和引用

为了方便，文件标识常被称为文件名

文件名包含三个部分：文件路径 + 文件名主干 + 文件后缀

例如：C:\Users\1\Desktop\C代码\c-code-submission\X形图案\X形图案\test.c

在\之前的内容表示文件所在路径，比如这个test.c文件在C盘，桌面目录中C代码目录下的c-code-submission目录下的X形图案目录下X形图案目录下的位置
该文件的文件名主干是test
该文件的文件后缀是.c

二、二进制文件和文本文件

根据数据的组织形式，数据文件可以分为文本文件和二进制文件。

我们都知道，数据在内存中都是以二进制形式存储的，如果不加以转换直接输出到外存的文件中，这种文件就是二进制文件。
如果要求在外存上以ASCII码形式存储，那么就需要在存储前加以转换。这种以ASCII码形式存储的文件就是文本文件。

在文件读写中会拓展一个数据在文件中的存储。

三、文件的使用

我们喝饮料一般分为三步：1. 打开瓶盖，2. 喝饮料，3. 观赏瓶盖。

文件使用与喝饮料一样，也分为三步：1. 打开文件，2. 读写文件，3. 关上文件。

3.1 流和标准流

在讲解文件之前，我们需要引入流的概念。

3.1.1 流

我们的程序需要输出到各种外部设备，也需要从外部设备中获取数据，不同的外部设备的输入输出操作各不相同，为了方便程序员对各种设备进行操作，我们抽象出了流的概念，我们可以把流想象成流淌着字符的河。

C程序针对文件，画面，键盘等的数据输入输出操作都是通过流操作的。

一般情况下，我们想向流里写数据，或者从流中读取数据，都是要打开流，然后操作。

3.1.2 标准流

那为什么我们从键盘输入数据，向屏幕上输出数据，并没有打开流呢？

那是因为C语言程序在启动时，默认打开3个流：

stdin - 标准输入流，在大多数环境中从键盘输入，scanf函数就是从标准输入流中读取数据。
stdout - 标准输出流，大多数环境中输出至显示屏界面，printf函数就是将信息输出到标准输出流中。
stderr - 标准错误流，大多数环境中输出到显示屏界面。

由于默认打开了这三个流，我们使用scanf，printf等函数就可以直接进行输入输出操作。

stdin，stdout，stderr这三个流的类型是：FILE*，通常称为文件指针。

在C语言中，就是通过FILE*的文件指针来维护流的各种操作。

3.2 文件指针

根据上面流的概念，我们需要对文件进行操作需要一个至关重要的桥梁——文件指针。

缓冲文件系统中，关键的概念是“文件类型指针”，简称“文件指针”。

每个被使用的文件都在内存中开辟了一个相应的文件信息区，用来存放文件的相关信息（如文件的名字，文件的状态及文件当前的位置等）。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的，取名FILE。

我们用图来更直观展示：

例如，VS2013编译环境提供的stdio.h头文件中有以下的文件类型声明：

struct _iobuf {
    char* _ptr;
    int _cnt;
    char* _base;
    int _flag;
    int _file;
    int _charbuf;
    int _bufsiz;
    char* _tmpfname;
};
typedef struct _iobuf FILE;

不同的C编译器的FILE类型包含的内容不完全相同，但是大同小异。
每当打开一个文件的时候，系统会根据文件的情况自动创建一个FILE结构的变量，并填充其中的信息，使用者不必关心细节。
一般都是通过一个FILE的指针来维护这个FILE结构体的变量，这样使用起来更加方便。

现在我们可以创建一个FILE类型的指针变量：

FILE* pf;//文件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区（是一个结构体变量）。通过该文件的文件信息区就能访问该文件。也就是说，通过文件指针变量能够间接找到与它相关联的文件。

例如：

3.3 文件的打开和关闭

现在我们已经能够访问一个文件了，接下来就是如何打开文件，读写文件，关闭文件。

注意：

文件在读写之前应该先打开文件，在使用结束之后应该关闭文件。
在编写程序的时候，再打开文件的同时，都会返回一个FILE*的指针变量指向该文件，也相当于建立了指针和文件的关系。
ANSI C规定使用fopen函数来打开文件，fclose函数来关闭文件。

3.3.1 打开——fopen函数

功能：打开文件。

返回值：FILE*的指针

对于返回值，如果打开成功，则是一个有效地址，如果打开失败，则返回NULL。

从fopen函数的定义上可以知道fopen有两个const char*的参数：filename和mode

filename：传入要打开的文件名（分为相对路径和绝对路径）。

①相对路径

例如：test.txt就是相对路径

相对路径是一个相对于当前源文件所在目录的一个路径。（必须与当前源文件在同一目录下）

我们看一下这个文件的位置：

②绝对路径

使用了绝对路径，我们打开的文件就不在局限于当前源文件同一目录下，可以使其他地方的文件。

总结：绝对路径不容易出错，但不够简便。相对路径是一个相对于当前源文件所在目录的一个路径，比绝对路径要简便，而且当某个外层文件夹的位置改动时，相对路径是不需要改变的，而绝对路径需要。

mode：文件的打开模式。下面是文件的打开模式：

注意：当使用“w”，“wb”，“w+”，“wb+”打开一个已经存在的文件时，会清空该文件所有内容。

3.3.2 关闭——fclose函数

功能：关闭文件

fclose函数只有一个参数：FILE* stream。

stream：传入要关闭的文件的文件指针。

返回值：整型。如果关闭成功返回0，关闭失败返回EOF（-1）。

下面是使用示例：

注意：不能对同一个指针连续fclose多次，否则编译器报错。

四、文件的读写

我们打开文件后，自然要对打开的文件进行读写操作，下面我们详细讲解如何进行文件读写。

文件的读写分为两种：顺序读写和随机读写。

4.1 文件顺序读写

对于顺序读写，我们经常使用一下函数：

下面来一一介绍。

4.1.1 字符输入——fgetc函数

功能：从文件中得到一个字符。

参数stream：要读取的文件的文件指针。

返回值：整型。返回的是这个字符的ASCII码值。

有些人觉得读取的是字符，为什么要返回它的ASCII码值呢，直接返回这个字符不行吗？这就涉及到文件末尾了。

如果这个函数读取到文件末尾或者读取出错，该函数会返回EOF（-1）。

运用实例：

先在文件中存一些数据

#include<stdio.h>
int main()
{
	FILE* pf = fopen("test.txt", "r");//打开文件
	//文件操作
	//判断文件是否打开成功
	if (pf == NULL)
	{
		printf("打开失败\n");
		return 1;
	}
	//读取文件
	int c = fgetc(pf);
	printf("%c ", c);
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

运行结果：

4.1.2 字符输出——fputc函数

功能：写入一个字符到文件中。

参数有两个：int character；FILE* stream

character：被写入的字符的ASCII码值，被写入时这个值要是unsigned char范围内的。

stream：一个指向打开的文件的指针。

返回值：整型。返回这个字符的ASCII码值。

同样，如果写入出错，返回EOF（-1）。所以返回值为int，而不是char。

运行示例：

我们让文件清空

#include<stdio.h>
int main()
{
	FILE* pf = fopen("test.txt", "w");//打开文件
	//要写入文件，以“w”模式打开文件
	//文件操作
	//判断文件是否打开成功
	if (pf == NULL)
	{
		printf("打开失败\n");
		return 1;
	}
	//写入文件
	int c = 'a';
	fputc(c, pf);
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

运行结果：

4.1.3 文本行输入——fgets函数

功能：从文件中得到字符串。

该函数有三个参数：char* str，int num，FILE* stream

str：指向复制读取的字符串的 char数组的指针。
num：要复制到 str 中的最大字符数（包括终止 null 字符）。
stream：指向标识输入流的 FILE 对象的指针。

返回值：指向该字符串的地址。

成功后，该函数返回 str。
如果在尝试读取字符时遇到文件末尾，则设置 eof 指示符 （feof）。如果在读取任何字符之前发生这种情况，则返回的指针为空指针（并且 str 的内容保持不变）。
如果发生读取错误，则设置错误指示符 （ferror），并返回 null 指针（但 str 指向的内容可能已更改）。

使用示例：

注意：该函数读取成功有两种结果：

①读取到了最大个数num时，这时函数并不会读取num个字符，只会读取num-1个，第num个字符会自动补充为'\0'。

很明显，a[9] != 'g'，反而a[9] == '\0'。

②还未读取到num-1个字符时，读取到了换行符'\n'，会结束读取，并在后面补上'\0'。所以，该函数最多只能读取一行的数据，也就知道了这函数叫文本行输入函数的原因。

这种情况，我们要将文件中的内容全部读取，而文件中有两行数据，就要使用两次fgets函数：

4.1.4 文本行输出——fputs函数

功能：写入一字符串到文件中。

参数有两个：const char* str；FILE* stream

str：指向一个要存放到文件里的字符串的指针。
stream：指向接收字符串的文件的指针。

返回值：成功后，将返回一个非负值。
出错时，该函数返回 EOF 并设置错误指示器 （ferror）。

使用示例：

注意：fputs函数会把整个字符串全部写入文件，而且会读取换行符('\n')。

4.1.5 格式化输入——fscanf函数

功能：从文件中读取格式化的数据。

参数：

stream：指向要读取数据的文件的指针。
format：被接受的数据的格式（与scanf一样，有%d，%s，%c等格式）。
…表示接收要读取的数据的变量名（与scanf后面的要输入的变量名一样）。

返回值：

成功后，该函数返回成功填充的参数列表的项数。此计数可能与预期的项目数匹配，也可能由于匹配失败、读取错误或文件末尾的范围而更少（甚至为零）。
如果在读取时发生读取错误或到达文件末尾，则设置正确的指示器（feof 或 ferror）。而且，如果在成功读取任何数据之前发生任何情况，则返回 EOF。

实际上，fscanf函数只比scanf多了stream这一个参数，如果stream为标准输入（stdin）时，与scanf函数没有区别。

使用示例：

4.1.6 格式化输出——fprintf函数

功能：将格式化的数据输入到文件中。

参数：

stream：指向要写入数据的文件的指针。
format：被写入的数据的格式（与printf一样，有%d，%s，%c等格式）。
…表示要输出到文件里的数据的变量名（与printf后面的变量名一样）。

返回值：

成功后，将返回写入的字符总数。
如果发生写入错误，则设置错误指示符 （ferror）并返回负数

fprintf与printf也只多了一个stream参数，表示写入的文件，当stream为标准输出（stdout）时，与printf的作用没有区别。

使用示例：

4.1.7 二进制输入——fread函数

对于二进制的文件，我们需要使用二进制的方式来读取，接下来介绍二进制输入输出函数。

注意：二进制的输入输出都是以字节为单位。

功能：从文件中读取数据块。

参数：

ptr：指向大小至少为（size*count）字节的内存块的指针，转换为 void*。
size：要读取的每个元素的大小（以字节为单位）。
count：元素数，每个元素的大小为字节。
stream：指向指定输入流的 FILE 对象的指针。

返回值：

返回成功读取的元素总数。
如果此数字与 count 参数不同，则表示读取时发生读取错误或到达文件末尾。在这两种情况下，都设置了正确的指标，可以分别使用 ferror 和 feof 进行检查。
如果 size 或 count 为零，则该函数返回零，并且 ptr 指向的流状态和内容保持不变。

二进制文件无法使用txt文件打开来获得想要的信息。

4.1.8 二进制输出——fwrite函数

功能：将数据块写入文件中。

参数：

ptr：指向要写入的元素数组的指针，转换为 const void*。
size：要写入的每个元素的大小（以字节为单位）。
count：元素数，每个元素的大小为字节。
stream：指向指定输出流的 FILE 对象的指针。

返回值：

返回成功写入的元素总数。
如果此数字与 count 参数不同，则写入错误会阻止函数完成。在这种情况下，将为流设置错误指示器 （ferror）。
如果 size 或 count 为零，则函数返回零，错误指示器保持不变。

使用示例：

4.1.9 拓展——sscanf，sprintf解析

4.1.9.1 sscanf函数

功能：从字符串中读取格式化数据。

参数：

s：被读取的字符串。
format：被接受的数据的格式（与scanf一样，有%d，%s，%c等格式）。
…（附加参数）：接收要读取的数据的变量名（与scanf后面的要输入的变量名一样）。

返回值：成功后，该函数返回成功填充的参数列表中的项数。此计数可以与预期的项目数匹配，也可以在匹配失败的情况下更少（甚至为零）。如果在成功解释任何数据之前发生输入失败，则返回 EOF。

使用示例：

4.1.9.2 sprintf函数

功能：将格式化的数据转换成字符串。

参数：

str：指向转换的字符串的指针。
format：被写入的数据的格式（与printf一样，有%d，%s，%c等格式）。
…：输出到字符串里的数据的变量名（与printf后面的变量名一样）。

返回值：成功后，将返回写入的字符总数。此计数不包括自动追加在字符串末尾的其他 null 字符。
失败时，返回负数。

使用示例：

4.2 文件随机读写

当用到文件随机读写，我们常会使用这三个函数：fseek，ftell，rewind。

4.2.1 fseek函数

功能：根据文件指针当前位置和偏移量重新定位文件指针。

参数：

stream：指向要改变定位的文件的指针。
offset：二进制文件：传入要偏移的偏移量。文本文件：零或 ftell 返回的值（不能直接传除0以外的整数，结果可能达不到预期，一定传ftell的返回值）。
origin：设置stream指针的起始位置。

origin有以下3个参数：

SEEK_SET：设置在文件开头。
SEEK_CUR：设置在指针的当前位置。（不改变指针位置）
SEEK_END：设置在文件结尾。

返回值：如果成功，该函数将返回零。否则，它将返回非零值。
如果发生读取或写入错误，则设置错误指示符 （ferror）。

使用示例：

4.2.2 ftell函数

功能：返回文件指针相对于起始位置的偏移量。

参数：stream：指向要计算偏移量的文件的指针。

返回值：成功后，返回位置指标的当前值。
失败时，返回 -1L，并将 errno 设置为特定于系统的正值。

使用示例：

4.2.3 rewind函数

功能：让指针的位置回到文件的起始位置。

参数：stream：指向要回到起始位置的文件的指针。

返回值：无。

使用示例：

五、文件读取结束的判定

feof和ferror这个函数会被许多人错误用来文件是否结束，我们来了解一下这两个函数以及如何判断文件是否读取结束。

5.1 feof函数

功能：当文件读取结束时，判断读取结束的原因是否是：遇到文件尾结束。

参数：stream：传入需要判断的文件的指针。

返回值：与到文件末尾而读取结束则返回非0值，其他原因返回0。

使用示例将与后面判断是否读取结束的用例在一起。

5.2 ferror函数

功能：判断读取的时候是否发生了错误。

参数：stream：传入要判断是否读取出错的文件的指针。

返回值：如果发生了错误则返回非0值，如果没有错误返回0。

5.3 文本文件判断

在前面的顺序读写函数中，我们通过其返回值可以判断是否读取结束。

文本文件读取是否结束，判断返回值是否为EOF（fgetc），或者NULL（fgets）。

例如：

fgetc判断是否为EOF
fgets判断是否为NULL

使用示例：

5.4 二进制文件判断

二进制文件的读取结束判断，判断返回值是否小于实际要读的个数。

例如：fread判断返回值是否小于实际要读的个数。

使用示例：

六、文件缓冲区

ANSIC 标准采用“缓冲文件系统” 处理的数据文件的，所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“ 文件缓冲区 ”。从内存向磁盘输出数据会先送到内存中的缓冲区，装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读入数据，则从磁盘⽂件中读取数据输入到内存缓冲区（充满缓冲区），然后再从缓冲区逐个地将数据送到程序数据区（程序变量等）。缓冲区的大小根据C编译系统决定的。