文件操作在我们的使用中虽然占的不多,但是有些时候,还是需要这部分的知识的。比如,我们做了一个C语言版的售卖系统。现在的想法是在关闭的时候保存这次的结果,然后下一次继续使用,这个时候,就可以使用文件操作。
一、什么是文件
在磁盘里面的文件就叫文件。在程序设计当中,我们一般说的文件有两种:程序文件和数据文件,这是从文件的功能来分类的。
程序文件,包括源文件(后缀为.c),目标文件(windows下后缀为.obj),可执行程序(windows下后缀为.exe)。下图为vs2019的几个程序文件。
数据文件是程序在运行时产生的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。我们来讨论的时数据文件。
根据数据的组织形式,数据文件被称为文本文件或二进制文件。数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。这个在文章后面会有说明。二进制文件相对于文本文件的一个好处就是占用的内存小。比如整型10000,用ASCII码的形式进行存储,就会占5个字节,而二进制则占4个字节。
处理数据的输入输出是以终端为对象的,也就是从键盘输入数据,将数据输入到内存当中,内存运行之后,将结构输出到显示屏上面。有的时候,我们将信息输出到磁盘上,需要的时候在从磁盘进行读取数据,以供内存使用。这个时候,处理的就是磁盘上的文件。
一个文件要有唯一的文件标识。文件名包括3个部分:文件路径+文件名主干+文件后缀。比如我们的电脑桌面:
C:\Users\****\Desktop
为了方便,文件标识常被称为文件名。下面,我们来进行文件的操作。
二、文件的打开和关闭
1,文件指针
在缓冲文件系统当中,一个很重要的概念是“文件类型指针”。简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE。
不同的C编译器的FILE类型包含的内容不完全相同,但都差不多。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并且填充这个文件包含的信息。
我们在写代码的时候,通过一个FILE的指针来维护这个变量。有如下定义:
FILE* pf;//文件指针变量
定义pf指向FILE类型的指针变量,让pf指向某一个文件的文件信息区,通过文件信息区中的文件来访问这个文件。也就是说,通过文件指针变量能够找到与它关联的文件。
2,文件打开与关闭
文件在读写之前需要打开文件,结束后关闭文件。文件一定是需要进行打开操作的。关闭操作是最好施行。虽然结束程序时系统会自动关闭,但是在使用的过程中,如果不关闭打开的文件,就会拖慢系统的运行速度。在打开文件的同时,会返回一个FILE*的指针来指向这个文件。我们使用 fopen 函数来打开文件,fclose 函数来关闭文件。fopen ,fclose函数的信息如下:
FILE *fopen( const char *filename, const char *mode );
头文件:<stdio.h>
filename:文件名称
mode:打开方式
返回值:如果打开成功,返回文件指针,打开失败,返回null。所以,一定要对该函数的返回值进行判断。
打开方式有以下的几个比较常用的,其他的可以自行查找。
int fclose( FILE *stream );
头文件:<stdio.h>
stream:也就是要关闭的指向文件结构的指针。简单记忆,就是要关闭的文件
返回值:如果流已成功关闭,fclose 将返回 0。否则返回 EOF 以指示错误。
下面,我们来看代码:
int main()
{
FILE* pf = fopen("data.txt", "r");//以读的形式打开
if (pr == NULL)
{
printf("errno!\n");
return;
}
fclose(pr);
pr = NULL;
return 0;
}
这样的代码是必不可少的。上面的“data.txt”会默认打开当前文件下的data.txt文件。要打开其他位置的文件,就要加完整的文件标识。要注意单个 \ 会当成会进行转义,需要 \\ 。
没有报错,说明打开成功。这里只是打开关闭文件操作。
三、文件操作相关的函数
1,文件的顺序读写
文件打开之后,按照顺序进行读写的操作叫文件的顺序读写。对文件的内容,可以一个字符进行读写,可以一行字符串进行读写,也可以整个文件进行读写。
在这里,需要强调一下:C语言程序,运行起来,就默认打开三个流:标准输入流(stdin)也就是键盘,标准输出流(stdout)也就是屏幕,标准错误流(stderr)。所有的输入输出流包括其他的比如文件之类的所有流。
还有一个容易犯迷糊的是输入输出。输入是键盘或文件将数据输入到内存,输出是内存将数据结果输出到屏幕或文件。
我们来看看几个函数。
(1),字符输入输出函数
int fgetc( FILE *stream );
头文件:<stdio.h>
stream:指向文件结构的指针。简单记忆,就是要打开的文件
返回值:如果读取成功,fgetc返回int类型的字符 。返回 EOF 以指示错误或文件结尾。为什么是返回int,是因为EOF的值是-1,如果是返回char,会导致错误。
int fputc( int c, FILE *stream );
头文件:<stdio.h>
stream:指向文件结构的指针。要打开的文件
返回值:返回写入的字符。返回值 EOF 表示错误。
来看以下代码:
首先,进行写的操作,在当前文件下用 “w” 打开文件"data.txt",如果没有,就新建一个这样的文件。然后往文件里面写入a~z的字符。用 fputc 函数一个字符一个字符从内存中输出到文件。运行成功的话,就会看见当前文件下多出了一个data.txt,里面还有a~z的字符。
#include<stdio.h>
#include <errno.h>
#include <string.h>
//写文件
int main(void)
{
//打开文件
FILE* pf = fopen("data.txt", "w");//写
if (pf == NULL)
{
printf("%s\n", strerror(errno));//显示错误的原因。
return;
}
//写文件
char ch = 0;
for (ch = 'a'; ch <= 'z'; ++ch)
{
fputc(ch, pf);//字符输出函数,从这里输出到data.txt
}
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
现在,我们要读出这些字符。以写的形式打开。
//读文件
int main(void)
{
//打开文件
//r--为了输入数据,打开一个已经存在的文本文件
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return;
}
//读文件
int ch = 0;
while ((ch = fgetc(pf)) != EOF)//EOF可以自行百度
{
printf("%c ", ch);
}
fclose(pf);
pf = NULL;
return 0;
}
(2),文本行输入输出函数
char *fgets( char *string, int n, FILE *stream );
头文件:<stdio.h>
string:数据的存储位置,键盘或文件中的字符串输出到内存的哪里。
n:要读取的最大字符数,读取的是n-1个字符。
stream:指向文件结构的指针。要打开的文件
返回值:返回字符串。返回 NULL 以指示错误或文件结束条件。
int fputs( const char *string, FILE *stream );
头文件:<stdio.h>
string:输出字符串。输出到文件或屏幕。
stream:指向文件结构的指针。要打开的文件。
返回值:如果成功,则每个函数都返回一个非负值。出现错误时,返回 EOF。
这两个函数只能对文件一行进行操作。
//写一行文件
int main(void)
{
//打开文件
FILE* pf = fopen("data.txt", "w");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return;
}
fputs("hello world\n", pf);//输出到文件
fputs("hello world\n", stdout);//输出到标准输出流
fclose(pf);
pf = NULL;
return 0;
}
//读一行文件,里面有abc def
int main(void)
{
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return;
}
char buf[1000] = { 0 };
//读一行文件,放在buf数组里面在打印。
fgets(buf, 3, pf);//n-1
printf("%s\n", buf);//ab
fclose(pf);
pf = NULL;
return 0;
}
现在,实现这样的一个功能:文件内容的拷贝,data.txt的内容拷贝到data2.txt当中。我们一个字符一个字符进行拷贝。自行运行一下,查看结果。
//文件内容拷贝
int main()
{
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return;
}
FILE* pw = fopen("data2.txt", "w");
int ch = 0;
//从pf当中输入到ch中
while ((ch = fgetc(pf)) != EOF)
{
//从ch中输出到pw中
fputc(ch, pw);
}
fclose(pf);
pf = NULL;
fclose(pw);
pw = NULL;
return 0;
}
(3),格式化输入输出函数
int fscanf( FILE *stream, const char *format [, argument ]... );
头文件:<stdio.h>
stream:指向文件结构的指针。
format:格式控制字符串,和scanf的格式是一样的。
这个函数主要是从标准输入流/指定的文件流上读取格式化的数据,比如%s %d %lf,那么这个函数就会按照这样的格式进行读取后,输入到内存当中。
int fprintf( FILE *stream, const char *format [, argument ]...);
头文件:<stdio.h>
format:格式控制字符串,和printf的格式是一样的。
这个函数主要是把内存里面的数据按格式输出到标准输出流/文件流,比如%s %d %lf,那么这个函数就会按照这样的格式进行读取后,输出到屏幕或文件当中。
我们使用结构体来进行说明。
struct Stu
{
char name[20];
int age;
double score;
};
//格式化输出到文件
int main(void)
{
struct Stu s = { "zhangsan", 20, 100 };
FILE* pf = fopen("data.txt", "w");
if (pf == NULL)
{
printf("error!\n");
return;
}
//写格式化的文件
fprintf(pf, "%s %d %lf", s.name, s.age, s.score);
fclose(pf);
pf = NULL;
return 0;
}
struct Stu
{
char name[20];
int age;
double score;
};
//格式化输入到内存
int main(void)
{
struct Stu s = { 0 };
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
printf("error!\n");
return;
}
//从文件读,输入到内存中
fscanf(pf, "%s %d %lf", s.name, &(s.age), &(s.score));
printf("%s %d %lf\n", s.name, s.age, s.score);
fclose(pf);
pf = NULL;
return 0;
}
(4),二进制输入输出
size_t fread( void *buffer, size_t size, size_t count, FILE *stream );
头文件:<stdio.h>
buffer:数据的存储位置。
size:单个数据大小(以字节为单位)。
count:要读取的最大数量。
stream:指向文件结构的指针。
返回值:fread 返回实际读取的完整个数,如果发生错误或在达到 count 之前遇到文件末尾,则该数目可能小于 count。
size_t fwrite( const void *buffer, size_t size, size_t count, FILE *stream );
头文件:<stdio.h>
buffer:数据要写入的位置。
size:单个数据大小(以字节为单位)。
count:要读取的最大数量。
stream:指向文件结构的指针。
返回值:fwrite 返回实际写入的完整个数,如果发生错误,该数目可能小于count。
这两个函数都是以二进制的方式来进行数据的输入输出。
struct Stu
{
char name[20];
int age;
double score;
};
//二进制方式写
int main()
{
struct Stu s = { "zhangsan", 20, 95.5 };
FILE* pf = fopen("data.txt", "wb");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return;
}
//按照二进制的方式写文件
fwrite(&s, sizeof(struct Stu), 1, pf);
fclose(pf);
pf = NULL;
return 0;
}
fread函数也是同样的道理,这里不再累述。
2,文件的随机读写
有的时候,我们不需要按顺序来进行读写,比如在一个文本当中有“abcdef”,我们希望一次就拿到里面的f,不需要一个字符一个字符进行读写,那么就需要文件的随机读写。
(1),fseek函数
根据文件指针的位置和偏移量来定位文件指针。
int fseek( FILE *stream, long offset, int origin );
头文件:<stdio.h>
offset:偏移量。向后偏移就是正数,向前偏移就是负数。
origin:起始位置,包括SEEK_STR, SEEK_CUR, SEEK_END。
SEEK_STR:文件开头位置;SEEK_CUR:文件指针的当前位置;SEEK_END:文件结尾位置。
要注意一下偏移量的计算,如下图所示。
如果指针指向了c字符,那么f相对于c字符就偏移了3。
int main()
{
FILE* pf = fopen("test.txt", "r");//文件内容是abcdef
if (pf == NULL)
{
printf("error!\n");
return;
}
//读文件
int ch = fgetc(pf);
printf("%c\n", ch);
//定位文件
fseek(pf, 3, SEEK_SET);
ch = fgetc(pf);
printf("%c\n", ch);//d
fseek(pf, 1, SEEK_CUR);
ch = fgetc(pf);
printf("%c\n", ch);//f
fseek(pf, -1, SEEK_END);
ch = fgetc(pf);
printf("%c\n", ch);//f
fclose(pf);
pf = NULL;
return 0;
}
但是有的时候,我们不知道文件指针相对于起始位置的偏移量,这个时候,就可以使用ftell函数来获得。
(2),ftell函数
long ftell( FILE *stream );
头文件:<stdio.h>
返回值:返回文件指针相对于起始位置的偏移量
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("error!\n");
return;
}
//读文件
int ch = fgetc(pf);
printf("%c\n", ch);//a
ch = fgetc(pf);
printf("%c\n", ch);//b
//计算偏移量
int ret = ftell(pf);
printf("%d\n", ret);//2偏移
fclose(pf);
pf = NULL;
return 0;
}
(3),rewind函数
void rewind( FILE *stream );
头文件:<stdio.h>
让文件指针的位置回到文件的起始位置
int main()
{
FILE* pf = fopen("test.txt", "r");//文件内容是abcdef
if (pf == NULL)
{
printf("error!\n");
return;
}
//读文件
int ch = fgetc(pf);
printf("%c\n", ch);//a
ch = fgetc(pf);
printf("%c\n", ch);//b
//计算偏移量
int ret = ftell(pf);
printf("%d\n", ret);//2偏移
//指针返回起始位置
rewind(pf);
ret = ftell(pf);
printf("%d\n", ret);//0
fclose(pf);
pf = NULL;
return 0;
}
3,文件读取结束的判定
函数feof经常被错误使用。不能使用feof函数的返回值来直接判断文件是否结束。而是当文件读取结束的时候,是判断读取失败结束,还是遇到文件结尾结束。
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
int c; // 注意:int,非char,要求处理EOF
FILE* fp = fopen("test.txt", "r");
if(!fp) {
perror("File opening failed");
return EXIT_FAILURE;
}
//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
{
putchar(c);
}
//判断是什么原因结束的
if (ferror(fp))
puts("I/O error when reading");
else if (feof(fp))
puts("End of file reached successfully");
fclose(fp);
fp = NULL;
return 0;
}
四、文件缓冲区
文件处理的过程,ANSIC 标准采用“缓冲文件系统”来处理文件的。在这个过程中,系统会自动在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
为什么要这么做?我们的系统同时运行着多个程序,如果有一个程序频繁调用操作系统,会造成其他程序无法正常使用。而引进文件缓冲机制,当缓冲区被装满之后在进行调用,可以提高效率。当然也可以强制调用操作系统。
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做,可能导致读写文件的问题。