文章目录
一:概述
我们对文件的概念已经非常熟悉了,比如常见的 Word 文档、txt 文件、源文件等。文件是数据源的一种,最主要的作用是保存数据。在操作系统中,为了统一对各种硬件的操作,简化接口,不同的硬件设备也都被看成一个文件。对这些文件的操作,等同于对磁盘上普通文件的操作。例如,通常把显示器称为标准输出文件,printf 就是向这个文件输出,把键盘称为标准输入文件,scanf 就是从这个文件获取数据。
常见硬件设备与文件的对应关系
文件 | 硬件设备 |
---|---|
stdin | 标准输入文件,一般指键盘;scanf()、getchar() 等函数默认从 stdin 获取输入。 |
stdout | 标准输出文件,一般指显示器;printf()、putchar() 等函数默认向 stdout 输出数据。 |
stderr | 标准错误文件,一般指显示器;perror() 等函数默认向 stderr 输出数据(后续会讲到)。 |
stdprn | 标准打印文件,一般指打印机。 |
二:文件流
所有的文件都是保存在磁盘上的,要载入内存才能处理,所有的数据必须写入文件(磁盘)才不会丢失。数据在文件和内存之间传递的过程叫做文件流,类似水从一个地方流动到另一个地方。数据从文件复制到内存的过程叫做输入流,从内存保存到文件的过程叫做输出流。所以,我们可以说打开文件就是打开了一个流。
三:文件的打开
在C语言中,文件操作都是由库函数来完成的。fopen函数用来打开一个文件FILE *fopen(char *filename, char *mode);
- filename为文件名(包括文件路径),mode为打开方式,他们都是字符串
- fopen()会获取文件信息,包括文件名,文件状态,当前读写位置等,并将这些信息保存到一个FILE类型的结构体变量中,然后将该变量的地址返回。
- FILE是在stdio.h头文件中定义的一个结构体,用来保存文件信息。
如果需要接收fopen()的返回值,就需要定义一个FILE类型的指针。例如:FILE *fp = fopen("demo.txt", "r");
表示以“只读”方式打开当前目录下的demo.txt文件,并使fp指向该文件,这样就可以通过fp来操作demo.txt了。fp通常被称为文件指针。
打开方式mode有多种:
打开方式 说明
r 以只读方式打开文件,只允许读取,不允许写入。该文件必须存在。
r+ 以读/写方式打开文件,允许读取和写入。该文件必须存在。
rb+ 以读/写方式打开一个二进制文件,允许读/写数据。
rt+ 以读/写方式打开一个文本文件,允许读和写。
w 以只写方式打开文件,若文件存在则长度清为0,即该文件内容消失,若不存在则创建该文件。
w+ 以读/写方式打开文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。
a 以追加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留(EOF符保留)。
a+ 以追加方式打开可读/写的文件。若文件不存在,则会建立该文件,如果文件存在,则写入的数据会被加到文件尾后,即文件原先的内容会被保留(原来的EOF符 不保留)。
wb 以只写方式打开或新建一个二进制文件,只允许写数据。
wb+ 以读/写方式打开或建立一个二进制文件,允许读和写。
wt+ 以读/写方式打开或建立一个文本文件,允许读写。
at+ 以读/写方式打开一个文本文件,允许读或在文本末追加数据。
ab+ 以读/写方式打开一个二进制文件,允许读或在文件末追加数据。
几点说明:
-
文件打开方式由r/w/a/t/b/+六个字符拼成,各字符的含义是:
r(read):读
w(write):写
a(append):追加
t(text):文本文件,可省略不写
b(banary):二进制文件
+:读和写 -
如果没有“b”字符,文件以文本方式打开。
-
凡用“r”打开一个文件时,该文件必须已经存在。
-
在打开一个文件时,如果出错,fopen将返回一个空指针值NULL。在程序中可以用这一信息来判别是否完成打开文件的工作,并作相应的处理。因此常用以下程序段打开文件:
if(fp = fopen("d:\\demo.txt", "rb") == NULL){ printf("error on open D:\\demo.txt file!"); getch(); // 该语句功能是:从键盘输入一个字符,但不在屏幕上显示。在这里,作用是等待,只有当用户从键盘敲任一键时,程序才继续执行。因此用户可利用这个等待时间阅读出错提示。 exit(1); }
-
把一个文本文件读入内存时,要将ASCII码转换成二进制码,而把文件以文本方式写入磁盘时,也要把二进制码转换为ASCII码,因此文本文件的读写要花费较多的转换时间。对二进制文件的读写不存在这种转换。
-
标准输入文件stdin(键盘)、标准输出文件stdout(显示器)、标准错误文件stderr(显示器)是由系统打开的,可直接使用。
四:文件关闭(fclose函数)
文件一旦使用完毕,应该用fclose()函数把文件关闭,以释放相关资源,避免数据丢失。fclose()的原型为:int fclose(FILE *fp);
fp为指针文件,例如:fclose(fp);
文件正常关闭时,fclose()的返回值为0,如果返回非零值则表示有错误发生。
五:读写文件
5.1:以字符的形式
5.1.1:概述
在C语言中,读写文件比较灵活,既可以每次读写一个字符,也可以读写一个字符串,甚至是任意字节的数据(数据块)。以字符形式读写文件时,每次可以从文件中读取一个字符,或者向文件中写入一个字符。主要使用两个函数:fgetc()
和fputc()
5.1.2:字符读取函数fgetc
fgetc是file get char的缩写,意思是从指定的文件中读取一个字符。原型为:int fgetc (FILE *fp);
fp为文件指针。fgetc()读取成功时返回读取到的字符,读取到文件末尾或读取失败时返回EOF。
EOF是end of file的缩写,表示文件末尾,是在stdio.h中定义的宏,值是一个负数,往往是-1。返回值类型之所以为int,就是为了容纳这个负数(char不能是负数)。
fgetc()使用举例:
char ch;
FILE *fp = fopen("d:\\demo.txt", "r+");
ch = fgetc(fp);
表示从d:\\demo.txt文件中读取一个字符,并保存到变量ch中。
在文件内部有一个位置指针,用来指向当前读写到的位置,也就是读写到第几个字节。在文件打开时,该指针总是指向文件的第一个字节。使用fgetc 函数后,该指针会向后移动一个字节,所以可以连续多次使用fgetc读取多个字符。
注意:这个文件内部的位置指针与C语言中的指针不是一回事。位置指针仅仅是一个标志,表示文件读写到的位置,也就是读写到第几个字节,它不表示地址。文件每读写一次,位置指针就会移动一次,它不需要你在程序中定义和赋值,而是由系统自动设置,对用户是透明的。
5.1.3:实例
#include <stdio.h>
int main(){
FILE *fp;
char ch;
// 如果文件不存在,给出提示并退出
if((fp=fopen("d:\\demo.txt", "rt")) == NULL){ // 这里的三对小括号都不能少,不能写成:if(fp=fopen("d:\\demo.txt", "rt") == NULL){
printf("cannot open file,press any key to exit!");
getch();
exit(1);
}
// 每次读取一个字节,直到读取完毕
while((ch = fgetc(fp)) != EOF){ // 这里三对小括号也不能少,要不然出现读取乱码,不知道为啥
putchar(ch);
}
putchar('\n'); // 输出换行符
fclose(fp);
return 0;
}
结果:aaaaaaaaaaaaaaaaaaaaaabbbbbbbbb
在D盘下创建demo.txt文件,输入任意内容并保存,运行程序,就会看到刚才输入的内容全部都显示在屏幕上。
该程序的功能是从文件中逐个读取字符,在屏幕上显示,直到读取完毕。
程序第14行是关键,while 循环的条件为(ch=fgetc(fp)) != EOF。fget() 每次从位置指针所在的位置读取一个字符,并保存到变量 ch,位置指针向后移动一个字节。
当文件指针移动到文件末尾时,fget() 就无法读取字符了,于是返回 EOF,表示文件读取结束了。
5.1.4:对EOF的说明
EOF本来表示文件末尾,意味着读取结束,但是很多函数在读取出错时也返回EOF,那么当返回EOF时,到底是文件读取完毕了还是读取出错了?我们可以借助stdio.h中的两个函数来判断,分别是feof()和ferror()
feof()函数用来判断文件内部指针是否指向了文件末尾,它的原型是:
inf feof(FILE *fp); 当指向文件末尾时,返回非零值,否则返回零值。
ferror()函数用来判断文件操作是否出错,它的原型是:
int ferror(FILE *fp); 出错返回非零值,否则返回零值。
实例:
#include <stdio.h>
int main(){
FILE *fp;
char ch;
// 判断文件是否存在
if((fp=fopen("d:\\demo.txt", "r+")) == NULL){
printf("cannot found file, press any key to exit!");
getch();
exit(1);
}
// 每次读取一个字节,直到读取完毕
while((ch = fgetc(fp)) != EOF){
putchar(ch);
}
putchar('\n');
if(ferror(fp)){
puts("读取出错");
}else{
puts("读取成功");
}
fclose(fp);
return 0;
}
结果:
aaaaaaaaaaaaaaaaaaaaaabbbbbbbbb
读取成功
5.1.5:字符写入函数fputc
fputc是file output char的缩写,意思是向指定的文件中写入一个字符。调用的形式为:int fputc(int ch, FILE *fp);
ch为要写入的字符,fp为文件指针。fputc()写入成功时返回写入的字符,失败时返回EOF,返回值类型为int也是为了容纳这个负数。
例如;
fputc('a', fp);
或者:
char ch = 'a';
fputc(ch, fp);
表示把字符'a'写入fp所指向的文件中。
两点说明:
- 被写入的文件可以用写、读写、追加方式打开,用写或读写方式打开一个已存在的文件时将清除原有的文件内容,并将写入的字符放在文件开头。如需保留原有文件内容,并把写入的字符放在文件末尾,就必须以追加方式打开文件。不管以何种方式打开,被写入的文件若不存在时则创建该文件。
- 每写入一个字符,文件内部位置指针向后移动一个字节。
实例:
#include <stdio.h>
int main(){
FILE *fp;
char ch;
// 判断文件是否成功打开
if((fp=fopen("d:\\demo.txt", "wt+")) == NULL){
printf("cannot open file, press any key to exit! \n");
getch();
exit(1);
}
printf("input a string: \n");
// 每次从键盘读取一个字符并写入文件
while((ch=getchar()) != '\n' ){
fputc(ch, fp);
}
fclose(fp);
return 0;
}
运行程序,输入一行字符并按回车键结束,打开D盘下的demo.txt文件,就可以看到刚才输入的内容。
5.2:以字符串的形式
5.2.1:引入
fgetc() 和 fputc() 函数每次只能读写一个字符,速度较慢;实际开发中往往是每次读写一个字符串或者一个数据块,这样能明显提高效率。
5.2.2:读字符串函数fgets
fgets()函数用来从指定的文件中读取一个字符串,并保存到字符数组中,它的原型为:char *fgets(char *str, int n, FILE *fp);
str为字符数组,n为要读取的字符数目,fp为文件指针。
返回值:读取成功时返回字符数组首地址,也即str; 读取失败时返回NULL; 如果开始读取时文件内部指针已经指向了文件末尾,那么将读取不到任何字符,也返回NULL
注意,读取到的字符串会在末尾自动添加 ‘\0’,n 个字符也包括 ‘\0’。也就是说,实际只读取到了 n-1 个字符,如果希望读取 100 个字符,n 的值应该为 101。例如:
#define N 101
char str[N];
FILE *fp = fopen("D:\\demo.txt", "r");
fgets(str, N, fp);
表示从 D:\\demo.txt 中读取100个字符,并保存到字符数组str中。
需要重点说明的是,在读取到 n-1 个字符之前如果出现了换行,或者读到了文件末尾,则读取结束。这就意味着,不管n的值多大,fgets() 最多只能读取一行数据,不能跨行。
在C语言中,没有按行读取文件的函数,我们可以借助 fgets(),将n的值设置地足够大,每次就可以读取到一行数据。
实例:
#include <stdio.h>
#include <stdlib.h>
#define N 100
int main(){
FILE *fp;
char str[N+1];
if((fp=fopen("d:\\demo.txt", "rt")) == NULL){
printf("cannot found file, press any key to exit! \n");
getch();
exit(1);
}
while(fgets(str, N, fp) != NULL){
printf("%s", str);
}
printf("\n");
fclose(fp);
system("pause");
return 0;
}
fgets() 遇到换行时,会将换行符一并读取到当前字符串。该示例的输出结果之所以和demo.txt保持一致,该换行的地方换行,就是因为fgets()能够读取到换行符。而gets()不一样,它会忽略换行符。
5.2.3:写字符串函数fputs
fputs()函数用来向指定的文件写入一个字符串,它的原型为:int fputs(char *str, FILE *fp);
str为要写入的字符串,fp为文件指针。写入成功返回非负数,失败返回EOF。
例如:
char *str = "http:www.qq.com";
FILE *fp = fopen("d:\\demo.txt", "a++");
fputs(str, fp);
表示把字符串str写入到d:\\demo.txt文件中
实例:
向上例中建立的d:\\demo.txt文件中追加一个字符串
#include <stdio.h>
int main(){
FILE *fp;
char str[102] = {0}, strTemp[100];
if((fp=fopen("d:\\demo.txt", "at+")) == NULL){
printf("cannot open file, press any key to exit! \n");
getch();
exit(1);
}
printf("input a string: ");
gets(strTemp);
strcat(str, "\n");
strcat(str, strTemp);
fputs(str, fp);
fclose(fp);
return 0;
}
5.3:以数据块的形式读写文件
fgets()有局限性,每次最多只能从文件中读取一行内容,因为fgets遇到换行符就结束读取。如果希望读取多行内容,需要使用fread函数,相应的写入函数fwrite。
fread()函数用来从指定文件中读取块数据。所谓块数据,也就是若干个字节的数据,可以是一个字符,可以是一个字符串,可以是多行数据,并没有什么限制。
fread()原型:
size_t fread(void *ptr, size_t size, size_t count, FILE *fp);
fwrite()函数用来向文件中写入块数据,它的原型:
size_t fwrite(void *ptr, size_t size, size_t count, FILE *fp);
对参数的说明:
- ptr 为内存区块的指针,它可以是数组、变量、结构体等。fread() 中的 ptr 用来存放读取到的数据,fwrite() 中的 ptr 用来存放要写入的数据。
- size:表示每个数据块的字节数。
- count:表示要读写的数据块的块数。理论上,每次读写 size*count 个字节的数据。
- fp:表示文件指针。
- size_t 是在 stddef.h 头文件中使用 typedef 定义的数据类型,表示无符号整数,也即非负数,常用来表示数量。
- 返回值:返回成功读写的块数,也即 count。如果返回值小于 count:
对于 fwrite() 来说,肯定发生了写入错误,可以用 ferror() 函数检测。
对于 fread() 来说,可能读到了文件末尾,可能发生了错误,可以用 ferror() 或 feof() 检测。
实例:
从键盘输入一个数组,将数组写入文件再读取出来
#include <stdio.h>
#define N 5
int main(){
// 从键盘输入的数据放入a,从文件读取的数据放入b
int a[N], b[N];
int i, size = sizeof(int);
FILE *fp;
if((fp=fopen("d:\\demo.txt", "rb+")) == NULL){
printf("cannot open file, press any key to exit! \n");
getch();
exit(1);
}
// 从键盘输入数据,并保存到数组a
for(i=0; i<N; i++){
scanf("%d", &a[i]);
}
// 将数组a的内容写入到文件
fwrite(a, size, N, fp);
// 将文件中的位置指针重新定位到文件开头
rewind(fp);
// 从文件读取内容并保存到数组b
fread(b, size, N, fp);
// 在屏幕上显示数组b的内容
for(i=0; i<N; i++){
printf("%d ", b[i]);
}
printf("\n");
fclose(fp);
system("pause");
return 0;
}
结果:
23 409 500 100 222↙
23 409 500 100 222
六:C语言文件的指针移动
6.1:引入
前面介绍的文件读写函数都是顺序读写,即读写文件只能从头开始,依次读写各个数据。但在实际开发中经常需要读写文件的中间部分,要解决这个问题,就得先移动文件内部的位置指针,再进行读写。这种读写方式称为随机读写,也就是说从文件的任意位置开始读写。实现随机读写的关键是要按要求移动位置指针,这称为文件的定位。
6.2:文件定位函数rewind和fseek
- rewind()用来将位置指针移动到文件开头:
void rewind(FILE *fp);
- fseek()用来将位置指针移动到任意位置:
int fseek(FILE *fp, long offset, int origin);
参数说明:
- fp 为文件指针,也就是被移动的文件。
- offset 为偏移量,也就是要移动的字节数。之所以为 long 类型,是希望移动的范围更大,能处理的文件更大。
- origin 为起始位置,也就是从何处开始计算偏移量。C语言规定的起始位置有三种,分别为文件开头、当前位置和文件末尾,每个位置都用对应的常量来表示:
起始点 常量名 常量值
文件开头 SEEK_SET 0
当前位置 SEEK_CUR 1
文件末尾 SEEK_END 2
例如,把位置指针移动到离文件开头100个字节处:fseek(fp, 100, 0);