文件操作详解

文件的定义

从文件的功能角度来分类,文件分为程序文件数据文件

1.  程序文件

包括我们常会看到并用到的源程序(.c/.cpp)、目标文件(.obj文件)以及可执行文件(.exe)

2.数据文件

文件的内容是程序运行时进行读写的数据

接下来我们主要介绍的是数据文件

 文件名 

一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀
例如: c:\code\test.txt
为了方便起见,文件标识常被称为文件名

 注:下文的读写是对文件而言(容易混淆)

缓冲文件系统中,关键的概念是文件类型指针,简称文件指针 每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名 字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统 声明的,取名FILE.

 

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量) 通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联 的文件(File* pf)

文件的打开与关闭

文件的读写之前需要写打开文件,使用结束后需要再关闭文件在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。

fopen()函数的第一个参数是文件名(一个字符串),第二个参数是打开模式(限制了权限)

详情如下:

其中如果打开的文件不存在或者不在本路径下 ,其中有些会直接报错,另外一些会直接在本路径下生成一个此文件名的文件

int main()
{
	//打开文件
	//FILE* pf = fopen(".\..\\..\\data.txt", "r");//相对路径
	//FILE* pf = fopen("D:\\code\\2023\\class111\\data.txt", "r");//绝对路径
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写文件
	//...
	
	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

文件的顺序读写

示例:

int main()
{
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写文件
	char ch = 0;
	for (ch = 'a'; ch <= 'z'; ch++)
	{
		if (ch % 5 == 0)
			fputc('\n', pf);
		fputc(ch, pf);
	}

	fclose(pf);
	pf = NULL;

	return 0;
}

输入输出流包括标准输入输出(stdin、stdout)流和文件流(指定某一个具体文件作为读写的对象)

上述所有读写函数均可在http://cplusplus.com上查找到,用法和参数的定义返回值的设定均有说明

除了后一组读写函数之外,其他函数均是读写文本文件,这一组是读写二进制文件且只适用于文件流

fputc

fputc函数可以向指定文件流或标准流进行写字符操作;如果多次重复对同一个文件流进行使用,写操作会从上一次读取的位置开始(文件结构体中附有专门的标记)

fgetc 

fgetc函数是与fputc函数是一组,它用来实现读操作的功能

根据描述我们知道应该用一个变量来接收来自文件的字符 进行验证

int main()
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//读文件
	int ch = 0;
	while ((ch = fgetc(pf)) != EOF)
	{
		printf("%c ", ch);
	}
	

	fclose(pf);
	pf = NULL;

	return 0;
}

首先打开文件,文件名为“data.txt”因为当前文件夹中并没有同文件名的文件,读写方式为“r”

所以会自动在本路径下创建空文件,然后提前在文件中写入一段文本如图:

程序会进行读操作将每一个字符读给ch变量并输出

这就验证了函数的有效性 

fputs

fputs实现将字符串写进文件的功能

int main()
{
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写文件
	//fputs("hello", pf);
	char arr[] = "hello";
	fputs(arr, pf);
	fputs("world", pf);

	fclose(pf);
	pf = NULL;

	return 0;
}

 首先将文件打开进行“w”写操作将字符串arr[]写进文件中之后关闭文件并将文件指针置空

下面是文件更新后的内容:

 

fgets

fgets函数是读取文件中字符串的的操作函数

fgets函数的参数中 num是指从文件中读取字符个数,stream 是指目的文件流 ,实现正常的话会返回字符串的首元素地址,失败的话返回NULL;

int main()
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//读文件
	char arr[100] = {0};
	fgets(arr, 100, pf);
	printf("%s", arr);

	fclose(pf);
	pf = NULL;

	return 0;
}

 读取来自文件中的num个字符串并将其赋值给arr字符数组并将其打印

 

格式化输入输出fscanf fprintf

为了体现格式化的效果所以建立结构体进行读写, 这两个函数的书写格式和scanf printf 相似

只是在原有参数放第一个参数 文件流

struct S
{
	float f;
	char c;
	int n;
};

int main()
{
	struct S s = { 3.14f, 'w', 100 };

	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写文件
	fprintf(pf, "%f-%c-%d", s.f, s.c, s.n);

	fclose(pf);
	pf = NULL;

	return 0;
}

代码段中的fprintf函数双引号引用的内容每个参数之间的 - 是分隔符没有特殊含义只使用来分开数据,也可换成其他符号,无特别要求。但是需要注意的是之后的fscanf的格式要一致;


struct S
{
	float f;
	char c;
	int n;
};

int main()
{
	struct S s = {0};

	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//读文件
	fscanf(pf, "%f-%c-%d", &(s.f), &(s.c), &(s.n));
	printf("%f-%c-%d\n", s.f, s.c, s.n);

	fclose(pf);
	pf = NULL;

	return 0;
}

 fwrite 

fwrite函数是写二进制数据到文件中 

int main()
{
	int arr[] = { 1,2,3,4,5,6,7,8,9,10 };
	//写文件
	FILE*pf = fopen("data.txt", "wb");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//二进制的写文件
	fwrite(arr, sizeof(arr[0]), sizeof(arr)/sizeof(arr[0]), pf);

	fclose(pf);
	pf = NULL;

	return 0;
}

这是写进文件后的文件内容(因为是二进制的数据所以是乱码)不过可以用fread读到原来的文件内容 

fread 

fread函数是读二进制文件的函数

int main()
{
	int arr[10] = {0};
	//写文件
	FILE* pf = fopen("data.txt", "rb");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//二进制的读文件
	fread(arr, sizeof(arr[0]), sizeof(arr) / sizeof(arr[0]), pf);

	int i = 0;
	for (i = 0; i < 10; i++)
	{
		printf("%d ", arr[i]);
	}

	fclose(pf);
	pf = NULL;

	return 0;
}

使用这个函数去读文件的二进制内容可以得到原数据 

文件的随机读写

fseek

origin是起始位置可以是下面三种

#include <stdio.h>

int main()
{
    // 以写文本的方式向文件中写出数据
    FILE *p = fopen("D:/File/number.dat", "w");
    // 写出 10 个字符
    char array[10] = {1,2,3,4,5,6,7,8,9,10};
    // 将 10 个字符写出到文件中
    fwrite(array, 1, sizeof(array), p);
    // 关闭文件
    fclose(p);


    // 正常读取文件前 2 字节
    FILE *p1 = fopen("D:/File/number.dat", "r");
    // 读取数据缓冲区
    char array1[2];
    // 读取前 2 字节
    fread(array1, 1, sizeof(array1), p1);
    // 打印前 2 字节数据
    printf("%d , %d\n", array1[0], array1[1]);


    // 跳过 4 字节读取文件 2 字节
    FILE *p2 = fopen("D:/File/number.dat", "r");
    // 读取数据缓冲区
    char array2[2];

    // 跳过 4 字节 , 此时当前位置是 0
    fseek(p2, 4, SEEK_CUR);

    // 读取 2 字节
    fread(array2, 1, sizeof(array2), p2);
    // 打印前 2 字节数据
    printf("%d , %d", array2[0], array2[1]);


    return 0;
}

 

ftell

rewind 

文本文件和二进制文件

根据数据的组织形式,数据文件被称为文本文件或者二进制文件
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是
本文件
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而
二进制形式输出,则在磁盘上只占4个字节

文件读取结束的判定

牢记:在文件读取过程中,不能用 feof 函数的返回值直接用来判断文件的是否结束。
feof函数 只会判断是否结束读取不知道是怎么结束的
而是 应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束
1. 文本文件读取是否结束,判断返回值是否为 EOF fgetc ),或者 NULL fgets
例如:
fgetc 判断是否为 EOF .
fgets 判断返回值是否为 NULL
2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread 判断返回值是否小于实际要读的个数
文本文件的例子:
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
   int c; // 注意:int,非char,要求处理EOF
   FILE* fp = fopen("test.txt", "r");
   if(!fp) {
       perror("File opening failed");
       return EXIT_FAILURE;
  }
//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
   while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
  {
      putchar(c);
  }
//判断是什么原因结束的
    if (ferror(fp))
        puts("I/O error when reading");
    else if (feof(fp))
        puts("End of file reached successfully");
    fclose(fp);
}

二进制文件的例子

#include <stdio.h>
enum { SIZE = 5 };
int main(void)
{
    double a[SIZE] = {1.,2.,3.,4.,5.};
    FILE *fp = fopen("test.bin", "wb"); // 必须用二进制模式
    fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组
    fclose(fp);
    double b[SIZE];
    fp = fopen("test.bin","rb");
    size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组
    if(ret_code == SIZE) {
        puts("Array read successfully, contents: ");
        for(int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
        putchar('\n');
   } else { // error handling
       if (feof(fp))
          printf("Error reading test.bin: unexpected end of file\n");
       else if (ferror(fp)) {
           perror("Error reading test.bin");
       }
   }
    fclose(fp);
}

文件缓冲区

ANSIC 标准采用缓冲文件系统处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序 中每一个正在使用的文件开辟一块“文件缓冲区。从内存向磁盘输出数据会先送到内存中的缓冲区,装 满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓 冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根 据C编译系统决定的。
#include <stdio.h>
#include <windows.h>
//VS2013 WIN10环境测试
int main()
{
 FILE*pf = fopen("test.txt", "w");
 fputs("abcdef", pf);//先将代码放在输出缓冲区
 printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
 Sleep(10000);
 printf("刷新缓冲区\n");
 fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
 //注:fflush 在高版本的VS上不能使用了
 printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
 Sleep(10000);
 fclose(pf);
 //注:fclose在关闭文件的时候,也会刷新缓冲区
 pf = NULL;
 return 0;
}

只有刷新缓冲区后才会将数据写到文件中,

这里可以得出一个结论
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文 件。 如果不做,可能导致读写文件的问题。

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值