文件操作详解

王维诗中的乌托邦

已于 2023-10-12 20:09:09 修改

阅读量70

点赞数 6

分类专栏： path of C语言文章标签： c语言

于 2023-10-11 11:28:44 首次发布

本文链接：https://blog.csdn.net/2202_75525641/article/details/133754924

版权

path of C语言专栏收录该内容

11 篇文章 0 订阅

订阅专栏

文件的定义

从文件的功能角度来分类，文件分为程序文件和数据文件

1. 程序文件

包括我们常会看到并用到的源程序(.c/.cpp)、目标文件（.obj文件）以及可执行文件(.exe)

2.数据文件

文件的内容是程序运行时进行读写的数据

接下来我们主要介绍的是数据文件

文件名

一个文件要有一个唯一的文件标识，以便用户识别和引用。

文件名包含3部分：文件路径+文件名主干+文件后缀

例如： c:\code\test.txt

为了方便起见，文件标识常被称为文件名

注：下文的读写是对文件而言（容易混淆）

缓冲文件系统中，关键的概念是“文件类型指针”，简称“文件指针”。 每个被使用的文件都在内存中开辟了一个相应的文件信息区，用来存放文件的相关信息（如文件的名 字，文件状态及文件当前的位置等）。这些信息是保存在一个结构体变量中的。该结构体类型是有系统 声明的，取名FILE.

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区（是一个结构体变量） 通过该文件信息区中的信息就能够访问该文件。也就是说，通过文件指针变量能够找到与它关联 的文件（File* pf）

文件的打开与关闭

文件的读写之前需要写打开文件，使用结束后需要再关闭文件在编写程序的时候，在打开文件的同时，都会返回一个FILE*的指针变量指向该文件，也相当于建立了指针和文件的关系。

fopen()函数的第一个参数是文件名（一个字符串），第二个参数是打开模式（限制了权限）

详情如下：

其中如果打开的文件不存在或者不在本路径下 ，其中有些会直接报错，另外一些会直接在本路径下生成一个此文件名的文件

int main()
{
	//打开文件
	//FILE* pf = fopen(".\..\\..\\data.txt", "r");//相对路径
	//FILE* pf = fopen("D:\\code\\2023\\class111\\data.txt", "r");//绝对路径
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写文件
	//...
	
	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

文件的顺序读写

示例：

int main()
{
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写文件
	char ch = 0;
	for (ch = 'a'; ch <= 'z'; ch++)
	{
		if (ch % 5 == 0)
			fputc('\n', pf);
		fputc(ch, pf);
	}

	fclose(pf);
	pf = NULL;

	return 0;
}

输入输出流包括标准输入输出（stdin、stdout）流和文件流(指定某一个具体文件作为读写的对象)

上述所有读写函数均可在http://cplusplus.com上查找到，用法和参数的定义返回值的设定均有说明

除了后一组读写函数之外，其他函数均是读写文本文件，这一组是读写二进制文件且只适用于文件流

fputc

fputc函数可以向指定文件流或标准流进行写字符操作；如果多次重复对同一个文件流进行使用，写操作会从上一次读取的位置开始（文件结构体中附有专门的标记）

fgetc

fgetc函数是与fputc函数是一组，它用来实现读操作的功能

根据描述我们知道应该用一个变量来接收来自文件的字符进行验证

int main()
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//读文件
	int ch = 0;
	while ((ch = fgetc(pf)) != EOF)
	{
		printf("%c ", ch);
	}
	

	fclose(pf);
	pf = NULL;

	return 0;
}

首先打开文件，文件名为“data.txt”因为当前文件夹中并没有同文件名的文件，读写方式为“r”

所以会自动在本路径下创建空文件，然后提前在文件中写入一段文本如图：

程序会进行读操作将每一个字符读给ch变量并输出

这就验证了函数的有效性

fputs

fputs实现将字符串写进文件的功能

int main()
{
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写文件
	//fputs("hello", pf);
	char arr[] = "hello";
	fputs(arr, pf);
	fputs("world", pf);

	fclose(pf);
	pf = NULL;

	return 0;
}

首先将文件打开进行“w”写操作将字符串arr[]写进文件中之后关闭文件并将文件指针置空

下面是文件更新后的内容：

fgets

fgets函数是读取文件中字符串的的操作函数

fgets函数的参数中 num是指从文件中读取字符个数，stream 是指目的文件流，实现正常的话会返回字符串的首元素地址，失败的话返回NULL；

int main()
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//读文件
	char arr[100] = {0};
	fgets(arr, 100, pf);
	printf("%s", arr);

	fclose(pf);
	pf = NULL;

	return 0;
}

读取来自文件中的num个字符串并将其赋值给arr字符数组并将其打印

格式化输入输出fscanf fprintf

为了体现格式化的效果所以建立结构体进行读写， 这两个函数的书写格式和scanf printf 相似

只是在原有参数放第一个参数文件流

struct S
{
	float f;
	char c;
	int n;
};

int main()
{
	struct S s = { 3.14f, 'w', 100 };

	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写文件
	fprintf(pf, "%f-%c-%d", s.f, s.c, s.n);

	fclose(pf);
	pf = NULL;

	return 0;
}

代码段中的fprintf函数双引号引用的内容每个参数之间的 - 是分隔符没有特殊含义只使用来分开数据，也可换成其他符号，无特别要求。但是需要注意的是之后的fscanf的格式要一致；


struct S
{
	float f;
	char c;
	int n;
};

int main()
{
	struct S s = {0};

	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//读文件
	fscanf(pf, "%f-%c-%d", &(s.f), &(s.c), &(s.n));
	printf("%f-%c-%d\n", s.f, s.c, s.n);

	fclose(pf);
	pf = NULL;

	return 0;
}

fwrite

fwrite函数是写二进制数据到文件中

int main()
{
	int arr[] = { 1,2,3,4,5,6,7,8,9,10 };
	//写文件
	FILE*pf = fopen("data.txt", "wb");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//二进制的写文件
	fwrite(arr, sizeof(arr[0]), sizeof(arr)/sizeof(arr[0]), pf);

	fclose(pf);
	pf = NULL;

	return 0;
}

这是写进文件后的文件内容（因为是二进制的数据所以是乱码）不过可以用fread读到原来的文件内容

fread

fread函数是读二进制文件的函数

int main()
{
	int arr[10] = {0};
	//写文件
	FILE* pf = fopen("data.txt", "rb");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//二进制的读文件
	fread(arr, sizeof(arr[0]), sizeof(arr) / sizeof(arr[0]), pf);

	int i = 0;
	for (i = 0; i < 10; i++)
	{
		printf("%d ", arr[i]);
	}

	fclose(pf);
	pf = NULL;

	return 0;
}

使用这个函数去读文件的二进制内容可以得到原数据

文件的随机读写

fseek

origin是起始位置可以是下面三种

#include <stdio.h>

int main()
{
    // 以写文本的方式向文件中写出数据
    FILE *p = fopen("D:/File/number.dat", "w");
    // 写出 10 个字符
    char array[10] = {1,2,3,4,5,6,7,8,9,10};
    // 将 10 个字符写出到文件中
    fwrite(array, 1, sizeof(array), p);
    // 关闭文件
    fclose(p);


    // 正常读取文件前 2 字节
    FILE *p1 = fopen("D:/File/number.dat", "r");
    // 读取数据缓冲区
    char array1[2];
    // 读取前 2 字节
    fread(array1, 1, sizeof(array1), p1);
    // 打印前 2 字节数据
    printf("%d , %d\n", array1[0], array1[1]);


    // 跳过 4 字节读取文件 2 字节
    FILE *p2 = fopen("D:/File/number.dat", "r");
    // 读取数据缓冲区
    char array2[2];

    // 跳过 4 字节 , 此时当前位置是 0
    fseek(p2, 4, SEEK_CUR);

    // 读取 2 字节
    fread(array2, 1, sizeof(array2), p2);
    // 打印前 2 字节数据
    printf("%d , %d", array2[0], array2[1]);


    return 0;
}

ftell

rewind

文本文件和二进制文件

根据数据的组织形式，数据文件被称为文本文件或者二进制文件。

数据在内存中以二进制的形式存储，如果不加转换的输出到外存，就是二进制文件。

如果要求在外存上以ASCII码的形式存储，则需要在存储前转换。以ASCII字符的形式存储的文件就是文

本文件。

一个数据在内存中是怎么存储的呢？

字符一律以ASCII形式存储，数值型数据既可以用ASCII形式存储，也可以使用二进制形式存储。

如有整数10000，如果以ASCII码的形式输出到磁盘，则磁盘中占用5个字节（每个字符一个字节），而

二进制形式输出，则在磁盘上只占4个字节

文件读取结束的判定

牢记：在文件读取过程中，不能用 feof 函数的返回值直接用来判断文件的是否结束。

feof函数 只会判断是否结束读取不知道是怎么结束的

而是 应用于当文件读取结束的时候，判断是读取失败结束，还是遇到文件尾结束 。

1. 文本文件读取是否结束，判断返回值是否为 EOF （ fgetc ），或者 NULL （ fgets ）

例如：

fgetc 判断是否为 EOF .

fgets 判断返回值是否为 NULL

2. 二进制文件的读取结束判断，判断返回值是否小于实际要读的个数。

例如：

fread 判断返回值是否小于实际要读的个数

文本文件的例子：

#include <stdio.h>
#include <stdlib.h>
int main(void)
{
   int c; // 注意：int，非char，要求处理EOF
   FILE* fp = fopen("test.txt", "r");
   if(!fp) {
       perror("File opening failed");
       return EXIT_FAILURE;
  }
//fgetc 当读取失败的时候或者遇到文件结束的时候，都会返回EOF
   while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
  {
      putchar(c);
  }
//判断是什么原因结束的
    if (ferror(fp))
        puts("I/O error when reading");
    else if (feof(fp))
        puts("End of file reached successfully");
    fclose(fp);
}

二进制文件的例子

#include <stdio.h>
enum { SIZE = 5 };
int main(void)
{
    double a[SIZE] = {1.,2.,3.,4.,5.};
    FILE *fp = fopen("test.bin", "wb"); // 必须用二进制模式
    fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组
    fclose(fp);
    double b[SIZE];
    fp = fopen("test.bin","rb");
    size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组
    if(ret_code == SIZE) {
        puts("Array read successfully, contents: ");
        for(int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
        putchar('\n');
   } else { // error handling
       if (feof(fp))
          printf("Error reading test.bin: unexpected end of file\n");
       else if (ferror(fp)) {
           perror("Error reading test.bin");
       }
   }
    fclose(fp);
}

文件缓冲区

ANSIC 标准采用“缓冲文件系统”处理的数据文件的，所谓缓冲文件系统是指系统自动地在内存中为程序 中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区，装 满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据，则从磁盘文件中读取数据输入到内存缓 冲区（充满缓冲区），然后再从缓冲区逐个地将数据送到程序数据区（程序变量等）。缓冲区的大小根 据C编译系统决定的。

#include <stdio.h>
#include <windows.h>
//VS2013 WIN10环境测试
int main()
{
 FILE*pf = fopen("test.txt", "w");
 fputs("abcdef", pf);//先将代码放在输出缓冲区
 printf("睡眠10秒-已经写数据了，打开test.txt文件，发现文件没有内容\n");
 Sleep(10000);
 printf("刷新缓冲区\n");
 fflush(pf);//刷新缓冲区时，才将输出缓冲区的数据写到文件（磁盘）
 //注：fflush 在高版本的VS上不能使用了
 printf("再睡眠10秒-此时，再次打开test.txt文件，文件有内容了\n");
 Sleep(10000);
 fclose(pf);
 //注：fclose在关闭文件的时候，也会刷新缓冲区
 pf = NULL;
 return 0;
}

只有刷新缓冲区后才会将数据写到文件中，

这里可以得出一个结论：

因为有缓冲区的存在，C语言在操作文件的时候，需要做刷新缓冲区或者在文件操作结束的时候关闭文 件。 如果不做，可能导致读写文件的问题。