C语言 文件操作

  文件操作在我们的使用中虽然占的不多,但是有些时候,还是需要这部分的知识的。比如,我们做了一个C语言版的售卖系统。现在的想法是在关闭的时候保存这次的结果,然后下一次继续使用,这个时候,就可以使用文件操作。

一、什么是文件

  在磁盘里面的文件就叫文件。在程序设计当中,我们一般说的文件有两种:程序文件和数据文件,这是从文件的功能来分类的。

  程序文件,包括源文件(后缀为.c),目标文件(windows下后缀为.obj),可执行程序(windows下后缀为.exe)。下图为vs2019的几个程序文件。

  数据文件是程序在运行时产生的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。我们来讨论的时数据文件。

  根据数据的组织形式,数据文件被称为文本文件或二进制文件。数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。这个在文章后面会有说明。二进制文件相对于文本文件的一个好处就是占用的内存小。比如整型10000,用ASCII码的形式进行存储,就会占5个字节,而二进制则占4个字节。

  处理数据的输入输出是以终端为对象的,也就是从键盘输入数据,将数据输入到内存当中,内存运行之后,将结构输出到显示屏上面。有的时候,我们将信息输出到磁盘上,需要的时候在从磁盘进行读取数据,以供内存使用。这个时候,处理的就是磁盘上的文件。

  一个文件要有唯一的文件标识。文件名包括3个部分:文件路径+文件名主干+文件后缀。比如我们的电脑桌面:

C:\Users\****\Desktop

为了方便,文件标识常被称为文件名。下面,我们来进行文件的操作。

二、文件的打开和关闭

1,文件指针

在缓冲文件系统当中,一个很重要的概念是“文件类型指针”。简称“文件指针”。

  每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE。

 不同的C编译器的FILE类型包含的内容不完全相同,但都差不多。

  每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并且填充这个文件包含的信息。

我们在写代码的时候,通过一个FILE的指针来维护这个变量。有如下定义:

FILE* pf;//文件指针变量

  定义pf指向FILE类型的指针变量,让pf指向某一个文件的文件信息区,通过文件信息区中的文件来访问这个文件。也就是说,通过文件指针变量能够找到与它关联的文件。

2,文件打开与关闭

  文件在读写之前需要打开文件,结束后关闭文件。文件一定是需要进行打开操作的。关闭操作是最好施行。虽然结束程序时系统会自动关闭,但是在使用的过程中,如果不关闭打开的文件,就会拖慢系统的运行速度。在打开文件的同时,会返回一个FILE*的指针来指向这个文件。我们使用 fopen 函数来打开文件,fclose 函数来关闭文件。fopen ,fclose函数的信息如下:

FILE *fopen( const char *filename, const char *mode );

头文件:<stdio.h>

filename:文件名称

mode:打开方式

返回值:如果打开成功,返回文件指针,打开失败,返回null。所以,一定要对该函数的返回值进行判断。

打开方式有以下的几个比较常用的,其他的可以自行查找。

int fclose( FILE *stream );

头文件:<stdio.h>

stream:也就是要关闭的指向文件结构的指针。简单记忆,就是要关闭的文件

返回值:如果流已成功关闭,fclose 将返回 0。否则返回 EOF 以指示错误。

下面,我们来看代码:

int main()
{
	FILE* pf = fopen("data.txt", "r");//以读的形式打开
	if (pr == NULL)
	{
		printf("errno!\n");
		return;
	}

	fclose(pr);
	pr = NULL;
	return 0;
}

  这样的代码是必不可少的。上面的“data.txt”会默认打开当前文件下的data.txt文件。要打开其他位置的文件,就要加完整的文件标识。要注意单个 \ 会当成会进行转义,需要 \\ 。

没有报错,说明打开成功。这里只是打开关闭文件操作。

三、文件操作相关的函数

1,文件的顺序读写

  文件打开之后,按照顺序进行读写的操作叫文件的顺序读写。对文件的内容,可以一个字符进行读写,可以一行字符串进行读写,也可以整个文件进行读写。

  在这里,需要强调一下:C语言程序,运行起来,就默认打开三个流:标准输入流(stdin)也就是键盘,标准输出流(stdout)也就是屏幕,标准错误流(stderr)。所有的输入输出流包括其他的比如文件之类的所有流。

  还有一个容易犯迷糊的是输入输出。输入是键盘或文件将数据输入到内存,输出是内存将数据结果输出到屏幕或文件。

 我们来看看几个函数。

(1),字符输入输出函数

int fgetc( FILE *stream );

头文件:<stdio.h>

stream:指向文件结构的指针。简单记忆,就是要打开的文件

返回值:如果读取成功,fgetc返回int类型的字符 。返回 EOF 以指示错误或文件结尾。为什么是返回int,是因为EOF的值是-1,如果是返回char,会导致错误。

 int fputc( int c, FILE *stream );

头文件:<stdio.h>

stream:指向文件结构的指针。要打开的文件

返回值:返回写入的字符。返回值 EOF 表示错误。 

来看以下代码:

首先,进行写的操作,在当前文件下用 “w” 打开文件"data.txt",如果没有,就新建一个这样的文件。然后往文件里面写入a~z的字符。用 fputc 函数一个字符一个字符从内存中输出到文件。运行成功的话,就会看见当前文件下多出了一个data.txt,里面还有a~z的字符。

#include<stdio.h>
#include <errno.h>
#include <string.h>

//写文件
int main(void)
{
	//打开文件
	FILE* pf = fopen("data.txt", "w");//写
	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));//显示错误的原因。
		return;
	}

	//写文件
	char ch = 0;
	for (ch = 'a'; ch <= 'z'; ++ch)
	{
		fputc(ch, pf);//字符输出函数,从这里输出到data.txt
	}

	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

 现在,我们要读出这些字符。以写的形式打开。

//读文件
int main(void)
{
	//打开文件
	//r--为了输入数据,打开一个已经存在的文本文件
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));
		return;
	}
	//读文件
	int ch = 0;
	while ((ch = fgetc(pf)) != EOF)//EOF可以自行百度
	{
		printf("%c ", ch);
	}

	fclose(pf);
	pf = NULL;
	return 0;
}

(2),文本行输入输出函数

 char *fgets( char *string, int n, FILE *stream );

头文件:<stdio.h>

string:数据的存储位置,键盘或文件中的字符串输出到内存的哪里。

n:要读取的最大字符数,读取的是n-1个字符。

stream:指向文件结构的指针。要打开的文件

返回值:返回字符串。返回 NULL 以指示错误或文件结束条件。 

int fputs( const char *string, FILE *stream );

头文件:<stdio.h>

string:输出字符串。输出到文件或屏幕。

stream:指向文件结构的指针。要打开的文件。

返回值:如果成功,则每个函数都返回一个非负值。出现错误时,返回 EOF。 

这两个函数只能对文件一行进行操作。 

//写一行文件
int main(void)
{
	//打开文件
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));
		return;
	}
	fputs("hello world\n", pf);//输出到文件
    fputs("hello world\n", stdout);//输出到标准输出流


	fclose(pf);
	pf = NULL;
	return 0;
}

//读一行文件,里面有abc def
int main(void)
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));
		return;
	}
	char buf[1000] = { 0 };
	//读一行文件,放在buf数组里面在打印。
	fgets(buf, 3, pf);//n-1
	printf("%s\n", buf);//ab

	fclose(pf);
	pf = NULL;
	return 0;
}

  现在,实现这样的一个功能:文件内容的拷贝,data.txt的内容拷贝到data2.txt当中。我们一个字符一个字符进行拷贝。自行运行一下,查看结果。

//文件内容拷贝
int main()
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));
		return;
	}
	FILE* pw = fopen("data2.txt", "w");

	int ch = 0;
	//从pf当中输入到ch中
	while ((ch = fgetc(pf)) != EOF)
	{
		//从ch中输出到pw中
		fputc(ch, pw);
	}

	fclose(pf);
	pf = NULL;
	fclose(pw);
	pw = NULL;
	return 0;
}

(3),格式化输入输出函数

int fscanf( FILE *stream, const char *format [, argument ]... );

头文件:<stdio.h>

stream:指向文件结构的指针。

format:格式控制字符串,和scanf的格式是一样的。

这个函数主要是从标准输入流/指定的文件流上读取格式化的数据,比如%s %d %lf,那么这个函数就会按照这样的格式进行读取后,输入到内存当中。

int fprintf( FILE *stream, const char *format [, argument ]...);

头文件:<stdio.h>

format:格式控制字符串,和printf的格式是一样的。

这个函数主要是把内存里面的数据按格式输出到标准输出流/文件流,比如%s %d %lf,那么这个函数就会按照这样的格式进行读取后,输出到屏幕或文件当中。

我们使用结构体来进行说明。

struct Stu
{
	char name[20];
	int age;
	double score;
};

//格式化输出到文件
int main(void)
{
	struct Stu s = { "zhangsan", 20, 100 };
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		printf("error!\n");
		return;
	}
	//写格式化的文件
	fprintf(pf, "%s %d %lf", s.name, s.age, s.score);
	
	fclose(pf);
	pf = NULL;
	return 0;
}

struct Stu
{
	char name[20];
	int age;
	double score;
};

//格式化输入到内存
int main(void)
{
	struct Stu s = { 0 };
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		printf("error!\n");
		return;
	}
	//从文件读,输入到内存中
	fscanf(pf, "%s %d %lf", s.name, &(s.age), &(s.score));
	printf("%s %d %lf\n", s.name, s.age, s.score);

	fclose(pf);
	pf = NULL;
	return 0;
}

 (4),二进制输入输出

size_t fread( void *buffer, size_t size, size_t count, FILE *stream );

头文件:<stdio.h>

buffer:数据的存储位置。

size:单个数据大小(以字节为单位)。

count:要读取的最大数量。

stream:指向文件结构的指针。

返回值:fread 返回实际读取的完整个数,如果发生错误或在达到 count 之前遇到文件末尾,则该数目可能小于 count。

 size_t fwrite( const void *buffer, size_t size, size_t count, FILE *stream );

头文件:<stdio.h>

buffer:数据要写入的位置。

size:单个数据大小(以字节为单位)。

count:要读取的最大数量。

stream:指向文件结构的指针。

返回值:fwrite 返回实际写入的完整个数,如果发生错误,该数目可能小于count。

这两个函数都是以二进制的方式来进行数据的输入输出。

struct Stu
{
	char name[20];
	int age;
	double score;
};

//二进制方式写
int main()
{
	struct Stu s = { "zhangsan", 20, 95.5 };
	FILE* pf = fopen("data.txt", "wb");
	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));
		return;
	}
	//按照二进制的方式写文件
	fwrite(&s, sizeof(struct Stu), 1, pf);

	fclose(pf);
	pf = NULL;

	return 0;
}

fread函数也是同样的道理,这里不再累述。

2,文件的随机读写

  有的时候,我们不需要按顺序来进行读写,比如在一个文本当中有“abcdef”,我们希望一次就拿到里面的f,不需要一个字符一个字符进行读写,那么就需要文件的随机读写。

(1),fseek函数

根据文件指针的位置和偏移量来定位文件指针。

int fseek( FILE *stream, long offset, int origin );

头文件:<stdio.h>

offset:偏移量。向后偏移就是正数,向前偏移就是负数。

origin:起始位置,包括SEEK_STR, SEEK_CUR, SEEK_END。

 SEEK_STR:文件开头位置;SEEK_CUR:文件指针的当前位置;SEEK_END:文件结尾位置。

要注意一下偏移量的计算,如下图所示。

如果指针指向了c字符,那么f相对于c字符就偏移了3。

int main()
{
	FILE* pf = fopen("test.txt", "r");//文件内容是abcdef
	if (pf == NULL)
	{
		printf("error!\n");
		return;
	}

	//读文件
	int ch = fgetc(pf);
	printf("%c\n", ch);

	//定位文件
	fseek(pf, 3, SEEK_SET);
	ch = fgetc(pf);
	printf("%c\n", ch);//d
	
	fseek(pf, 1, SEEK_CUR);
	ch = fgetc(pf);
	printf("%c\n", ch);//f
	
	fseek(pf, -1, SEEK_END);
	ch = fgetc(pf);
	printf("%c\n", ch);//f
	fclose(pf);
	pf = NULL;
	return 0;
}

但是有的时候,我们不知道文件指针相对于起始位置的偏移量,这个时候,就可以使用ftell函数来获得。

(2),ftell函数

long ftell( FILE *stream );

头文件:<stdio.h>

返回值:返回文件指针相对于起始位置的偏移量

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		printf("error!\n");
		return;
	}

	//读文件
	int ch = fgetc(pf);
	printf("%c\n", ch);//a

	ch = fgetc(pf);
	printf("%c\n", ch);//b

	//计算偏移量
	int ret = ftell(pf);
	printf("%d\n", ret);//2偏移

	fclose(pf);
	pf = NULL;
	return 0;
}

(3),rewind函数

void rewind( FILE *stream );

头文件:<stdio.h>

让文件指针的位置回到文件的起始位置

int main()
{
	FILE* pf = fopen("test.txt", "r");//文件内容是abcdef
	if (pf == NULL)
	{
		printf("error!\n");
		return;
	}

	//读文件
	int ch = fgetc(pf);
	printf("%c\n", ch);//a

	ch = fgetc(pf);
	printf("%c\n", ch);//b

	//计算偏移量
	int ret = ftell(pf);
	printf("%d\n", ret);//2偏移

	//指针返回起始位置
	rewind(pf);
	ret = ftell(pf);
	printf("%d\n", ret);//0

	fclose(pf);
	pf = NULL;
	return 0;
}

3,文件读取结束的判定

函数feof经常被错误使用。不能使用feof函数的返回值来直接判断文件是否结束。而是当文件读取结束的时候,是判断读取失败结束,还是遇到文件结尾结束。

#include <stdio.h>
#include <stdlib.h>

int main(void)
{
    int c; // 注意:int,非char,要求处理EOF
    FILE* fp = fopen("test.txt", "r");
    if(!fp) {
        perror("File opening failed");
        return EXIT_FAILURE;
   }

    //fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
    while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
   { 
       putchar(c);
   }
    //判断是什么原因结束的
    if (ferror(fp))
        puts("I/O error when reading");
    else if (feof(fp))
        puts("End of file reached successfully");

    fclose(fp);
    fp = NULL;
    return 0;
}

 四、文件缓冲区

  文件处理的过程,ANSIC 标准采用“缓冲文件系统”来处理文件的。在这个过程中,系统会自动在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。

  为什么要这么做?我们的系统同时运行着多个程序,如果有一个程序频繁调用操作系统,会造成其他程序无法正常使用。而引进文件缓冲机制,当缓冲区被装满之后在进行调用,可以提高效率。当然也可以强制调用操作系统。 

  因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做,可能导致读写文件的问题。

  • 12
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值