一、文件的概述
1.文件的分类
所谓“文件”,是指一组相关数据的有序集合。这个数据集有一个名称,叫作文件名。实际上在前面的各章中我们已经多次使用了文件,例如源程序文件、目标文件、可执行文件、库文件(头文件)等。
文件通常是驻留在外部介质(如磁盘等)上的,在使用时才调入内存中。从不同的角度可对文件进行不同的分类。从用户的角度,文件可分为普通文件和设备文件两种。
普通文件是指驻留在磁盘或其他外部介质上的一个有序数据集,可以是源文件、目标文件、可执行程序;也可以是一组待输入处理的原始数据,或者是一组输出的结果。源文件、目标文件、可执行程序可以称作程序文件,输入/输出数据可称作数据文件。
2.文件指针
在C语言中若用一个指针变量指向一个文件,这个文件就称为文件指针。通过文件指针就可以对它 所指的文件进行各种操作。
定义说明文件指针的一般形式为: FILE *指针变量标识符;
FILE为大写,它实际上是由系统定义的一个结构,该结构中含有文件名、文件状态和文件当前位置等信息。在编写源程序时不必关心FILE结构的细节。
例如: FILE *fp;
该语句表示fp是指向FILE结构的指针变量,通过fp即可找到存放某个文件信息的结构信息,然后按结构变量提供的信息找到该文件,实施对文件的操作。习惯上也笼统地把fp称为指向一个文件的指针。
二、文件的打开和关闭
文件在进行读写操作之前要先打开,使用完毕要关闭。所谓打开文件,实际上是建立文件的各种有关信息,并使文件指针指向该文件,以便进行其他操作。关闭文件则是断开指针与文件之间的联系,也就是禁止再对该文件进行操作。
1.文件的打开(fopen函数)
foprn函数用来打开一个文件,其调用的一般形式为: 文件指针名=fopen(文件名 , 使用文件方式);
“文件指针名”必须是被说明为FILE类型的指针变量。
“文件名”是被打开文件的文件名(位置),是字符串常量或字符串数组。
“使用文件方式”是指文件的类型和操作要求。
例如:
FILE *fp;
fp =fopen("C:\\aa.txt","r");
其意义是打开c盘下的文件aa.txt。只进行“读”操作,并使fp指向该文件。两个反斜杠“\\"中的第一个表示转义字符,第二个表示根目录。
文件使用方式 | 意义 |
” rt “ | 只读打开一个文本文件,只允许读数据 |
" wt " | 只写打开或建立一个文本文件,只允许写数据 |
" at " | 追加打开一个文本文件,并在文件末尾写数据 |
" rb " | 只读打开一个二进制文件,只允许读数据 |
" wb " | 只写打开一个二进制文件,只允许读数据 |
" ab " | 追加打开一个二进制文件,并在文件末尾写数据 |
" rt+ " | 读写打开一个文本文件,允许读和写 |
" wt+ " | 读写打开或建立一个文本文件,允许读和写 |
" rb+ " | 读写打开一个二进制文件,允许读和写 |
" wb+ " | 读写打开或建立一个二进制文件,允许读与写 |
" ab+ " | 读写打开一个二进制文件,允许读,或在文件末追加数据 |
" at+ " | 读写打开一个文本文件,允许读,或在文本末追加数据 |
对文件的使用方式以下有几点说明:
(1)文件使用方式由r、w、a、t、b、+共6个字符组合成,各字符的含义如下。
r(read) 读
w(write) 写
a(append) 追加
t(text) 文本文件,可省略不写
b(banary) 二进制文件
+ 读和写
(2)凡用” r “打开一个文件时,该文件必须已经存在,且只能从该文件读出。
(3)用” w “打开的文件只能向该文件写入。若打开的文件不存在,则以指定的文件名建立该文件;若打开的文件已经存在,则将该文件删去,再建一个新文件。
(4)若要向一个已存在的文件追加新的信息,只能用” a “方式打开文件。但此时该文件必须时存在的,否则将会出错。
(5)在打开一个文件时,如果出错,fopen将返回一个空指针值NULL。在程序中可以用这一信息来判别是否完成打开文件的工作,并做相应的处理。因此常用以下程序段打开文件:
if(fp==NULL){
printf("打开文件失败\n");
}
(6)把一个文本文件读入内存时,要将ASCII码转换成二进制码,而把文件以文本方式写入磁盘时,也要把二进制码转换成ASCII码,因此对文本文件的读写要花费较多的转换时间。对二进制文件的读写不存在这种转换。
(7)标准输入文件stdin(键盘)、标准输出文件stdout(显示器)、标准出错文件stderr(出错信息)是由系统打开的,可直接使用。
2.文件关闭函数(fclose函数)
文件一旦使用完毕,应该用关闭文件函数fclose把文件关闭,以避免文件的数据丢失等数据。
fclose函数调用的一般形式是: fclose(文件指针);
例如: fclose(fp);
正常完成关闭文件操作时,fclose函数返回值为0。如返回非零值则表示有错误发生。
三、文件的读写
1.读字符函数fgetc
fgetc函数的功能时从指定的文件中读一个字符,函数调用的形式为: 字符变量=fgetc(文件指针);
例如: ch=fgetc(fp);
其意义是从打开的文件fp中读取一个字符并送入ch中。
fgetc函数的使用有以下几点说明:
(1)在fgetc函数调用中,读取的文件必须是以读或写方式打开的。
(2)读取字符的结果也可以不向字符变量赋值,例如:fgetc(fp)。这样读出的字符不能保存。
(3)在文件内部有一个位置指针。它用来指向文件的当前读写字节。在文件打开时,该指针总是指向文件的第一个字节。使用fgetc函数后,该位置指针将向后移动一个字节。因此可连续多次使用fgetc函数,读取多个字符。应注意文件指针和文件内部的位置指针不是一回事。文件指针是指向整个文件的,须在程序中定义说明,只要不重新赋值,文件指针的值是不变的;文件内部的位置指针用以指示文件内部的当前读写位置,每读写一次,该指针均向后移动,它无须再程序中定义说明,而是由系统自动设置的。
例题:读入一个文件,在计算机屏幕上输出。
#include <stdio.h>
int main(){
FILE *fp;
//打开文件
fp=fopen("C:\\aa.txt","r");
if(fp==NULL){
printf("打开文件失败\n");
}
char ch= fgetc(fp);
while(ch!=EOF){
printf("%c",ch);
ch=fgetc(fp);
}
//关闭文件
fclose(fp);
return 0;
}
运行结果:文件:
2.写字符函数fputc
fputc函数的功能是把一个字符写入指定的文件中,函数调用的形式为: fputc(字符量 , 文件指针);
待写入的字符量可以是字符常量或变量。例如: fputc( 'a' , fp );
意义把字符a写入fp所指向的文件中。
fputc函数的使用有以下几点说明:
(1)被写入的文件可以用写、读写、追加方式打开,用写或读写方式打开一个已存在的文件时将清除原有的文件内容。写入字符从文件首开始。如需保留原有文件内容,希望写入的字符从文件末开始存放,必须以追加方式打开文件。被写入的文件若不存在,则创建该文件。
(2)每写入一个字符,文件内部位置指针向后移动一个字节。
(3)fputc函数有一个返回值,如写入成功则返回写入的字符,否则返回一个EOF。可用此来判断写入是否成功。
例题: 从键盘输入字符串,写入一个文件,再把文件内容读出。
#include <stdio.h>
int main(){
FILE *fp;
//打开文件,进行写和读
fp=fopen("C:\\aa.txt","wt+");
if(fp==NULL){
printf("打开文件失败\n");
}
printf("输入字符串:\n");
char ch;
ch=getchar();
while(ch!='\n'){ //按回车则跳出
fputc(ch,fp);
ch=getchar();
}
//rewind函数用来将位置指针移动到文件开头
rewind(fp);
ch=fgetc(fp);
while(ch!=EOF){
putchar(ch);
ch=fgetc(fp);
}
printf("\n");
//关闭文件
fclose(fp);
return 0;
}
运行结果运行后的文件
程序分析: 从ch=getchar();开始从键盘读入一个字符后进入循环,当读入字符不为回车符时,则把该字符写入文件之中,然后继续从键盘读入下一个字符。每输入一个字符,文件内部指针向后移动一个字节。写入完毕后该指针已指向文件末。如果要把文件从头读出,须把指针移向文件头,所有用rewind函数把fp所指文件的内部位置指针移到文件头。
3.读字符串函数fgets
函数的功能是从指定的文件中读一个字符串到字符数组中。
函数调用的形式为: fgets(字符数组名 , n , 文件指针);
n是一个正整数。表示从文件中读出的字符串不超过n-1各字符。在读入的最后一个字符后加上字符串结束标志 '\0' 。
例如: fgets(str, n , fp);
意义是从fp所指的文件中读出n-1个字符送入字符数组str中。
例题:从aa.txt文件中读入一个含10字符的字符串。
#include <stdio.h>
int main(){
FILE *fp;
char str[11];
//打开文件
fp=fopen("C:\\aa.txt","r");
if(fp==NULL){
printf("打开文件失败\n");
}
fgets(str,11,fp);
printf("%s",str);
//关闭文件
fclose(fp);
return 0;
}
运行结果:文件:
程序分析:定义一个字符数组str,11个字节。在以读文本文件方式打开文件后,从中读出10个字符送入str数组,在数组最后一个单元内将加上'\0',然后在输出str数组。
(1)在读出n-1个字符之前,如遇到了换行符或EOF,则读出结束。
(2)fgets函数也有返回值,其返回值是字符数组的首地址。
4.写字符串函数fputs
fputs函数的功能是向指定的文件写入一个字符串,其调用形式为:fputs(字符串 , 文件指针);
其中字符串可以是字符串常量,也可以是字符数组名,或指针变量。例如:fputs("abc",fp);
其意义是把字符串"abc"写入fp所指的文件之中。
例题: 在上面的例子中追加一个字符串,并输出全部。
#include <stdio.h>
int main(){
FILE *fp;
//打开文件,进行写和读
fp=fopen("C:\\aa.txt","at+");
if(fp==NULL){
printf("打开文件失败\n");
}
printf("输入字符串:\n");
char ch,st[20];
scanf("%s",st);
fputs(st,fp);
//rewind函数用来将位置指针移动到文件开头
rewind(fp);
ch=fgetc(fp);
while(ch!=EOF){
putchar(ch);
ch=fgetc(fp);
}
printf("\n");
//关闭文件
fclose(fp);
return 0;
}
追加abcd运行结果:
5.数据块读写函数
C语言还提供了用于读写整块数据的函数,可用来读写一组数据,如一个数组元素、一个结构变量的值等。
读数据块函数调用的一般形式:fread(buffer , size , count , fp);
写数据块函数调用的一般形式:fwrite(buffer , size , count , fp);
buffer是一个指针,在fread函数中,它表示存放输入数据的首地址。在fwrite函数中,它表示存放输出数据的首地址。size表示数据块的字节数。count表示要写的数据块块数。fp表示文件指针。
例如: fread(fa,4,5,fp);
其意义是从fp所指的文件中,每次读4个字节(一个实数)送入实数组fa中,连续读5次,即读5个实数到fa中。
例题:从键盘输入两个学生的数据,写入一个文件中,在读出这两个学生的数据。
#include <stdio.h>
struct student{
char name[10];
int sno;
int age;
char addr[30];
}boya[2],boyb[2],*p,*q;;
int main(){
p=boya;
q=boyb;
int i;
FILE *fp;
fp=fopen("C:\\aa.txt","wb+");
if(fp==NULL){
printf("打开文件失败\n");
}
printf("输入数据:\n");
for(i=1;i<=2;i++,p++){
scanf("%s%d%d%s",p->name,&p->sno,&p->age,p->addr);
}
p=boya;
fwrite(p,sizeof(struct student),2,fp);
rewind(fp);
fread(q,sizeof(struct student),2,fp);
printf("姓名\t学号\t年龄\t地址\n");
for(i=1;i<=2;i++,q++){
printf("%s\t%d\t%d\t%s\n",q->name,q->sno,q->age,q->addr);
}
fclose(fp);
return 0;
}
6.格式化读写函数
fscanf函数、fprintf函数与前面使用的scanf和printf函数的功能相似,都是格式化读写函数。两者的区别在于fscanf函数和fprintf函数的读写对象不是键盘和显示器,而是磁盘文件。
两个函数的调用格式为:
fscanf(文件指针 , 格式字符串 , 输入表列);
fprintf(文件指针 , 格式字符串 , 输出表列);
四、文件的定位
前面介绍的对文件的读写方式都是顺序读写,即读写文件只能从头开始,顺序读写各个数据。但在实际问题中常要求只读写文件中某一指定的部分。为了解决这个问题,可移动文件内部的位置指针到需要读写的位置,再进行读写,这种读写称为随机读写。实现随机读写的关键是要按要求移动位置指针,这称为文件的定位。移动文件内部位置指针的函数主要有两个,即rewind函数和fseek函数。
rewind函数调用形式为: rewind(文件指针);
功能是把文件内部的位置指针移到文件首。
fseek函数用来移动文件内部位置指针,调用形式为: fseek(文件指针 , 位移量 , 起始点);
“文件指针”指向被移动的文件。“位移量”表示移动的字节数,要求位移量是long型数据,以便在文件长度大于64KB时不会出错。当用常量表示位移量时,要求加后缀“L" 。”起始点“表示从何处开始计算位移量。规定的起始点有3中:文件首、当前位置和文件尾,其表示方法如下。
起始点 | 表示符号 | 数组表示 |
文件首 | SEEK-SET | 0 |
当前位置 | SEEK-CUR | 1 |
文件末尾 | SEEK-END | 2 |
例如: fseek(fp,100L,0);
其意义是把位置指针移到离文件首100个字节处。还要说明的是fseek函数一般用于二进制文件。
在文本文件中由于要进行转换,故往往计算的位置会出现错误。文件的随机读写在移动位置指针之后,即可用前面介绍的任意一种读写函数进行读写。由于一般是读写一个数据块,因此常用fread和fwrite函数。