文件分类
按文件的逻辑结构
记录文件:由具有一定结构的记录组成(定长和不定长)。
流式文件:由一个个字符(字节)数据顺序组成。
按存储介质
普通文件:存储介质文件(磁盘、磁带等)。
设备文件:非存储介质(键盘、显示器、打印机等)。
按数据的组织形式
文本文件:ASCII文件,每个字节存放一个字符的ASCII码。
二进制文件:数据按其在内存中的存储形式原样存放。
每个文件都以文件名作为标识,I/O设备的文件名是系统定义的,比如:
COM1或者AUX —— 第一串行口,附加设备。
COM2 —— 第二串行口,此外还可能有COM3、COM4等。
CON —— 控制台,键盘或者显示器。
LPT1或者PRN —— 第一并行口或者打印机。
LP2 —— 第二并行口,还可能有LP3等。
NUL —— 空设备。
磁盘文件可以由用户自己命名,但上述被系统(Windows,Linux另有一套设备命名方法)保留的设备名字不能用作文件名。
流概念
流是一个动态的概念,可以将一个字节形象地比喻成一滴水,字节在设备、文件和程序之间的传输就是流。类似于水在管道中的传输,可以看出,流式对输入输出源的一种抽象,也是对传输信息的一种抽象。
通过对输入输出源的抽象,屏蔽了设备之间的差异,使程序员能够以一种通用的方式进行存储操作,通过对传输信息的抽象,使得所有信息都转化为字节流的形式传输,信息解读的过程与传输的过程分离。
C语言当中,I/O操作可以简单地看做是从程序移进或者移除字节,这种搬运的过程便成为流(stream)。程序只需要关心是否正确地输出了字节数据,以及是否正确地输入了要读取的字节数据,特定I/O设备的细节对程序员是隐藏的。
文件处理方法
缓冲文件系统:高级文件系统,系统自动为正在使用的文件开辟内存缓冲区。
非缓冲文件系统:低级文件系统,由用户在程序中为每个文件设定缓冲区。
缓冲文件系统理解:文件句柄
文件操作API
文件读写api
fgetc fputc 按照字符读写文件
fputs fgets 按照行读写文件(读写配置文件)
fread fwrite 按照块读写文件(大数据块迁移)
fprintf 按照格式化进行读写文件
fprintf(fp,"%s = %s\n",pKey,pValue);
文件控制api
fseek(fp,0L,SEEK_END); //把文件的指针从0位置,移动到文件末尾
length = ftell(fp); //获取文件的长度
fseek(fp,0L,SEEK_SET); //把文件指针,移动到文件头。
int fseek(FILE *stream, long offset, int fromwhere);
// 函数设置文件指针stream的位置。如果执行成功,stream将指向以fromwhere为基准,偏移offset个字节的位置。如果执行失败(比如offset超过文件自身大小),则不改变stream指向的位置。
标准文件的读写
文件的打开fopen()
文件的打开操作表示将给用户指定的文件在内存分配一个FILE结构区,并将该结构的指针返回给用户程序,以后用户程序就可以用此FILE指针来实现对指定文件的读取操作了。
当使用打开函数时,必须给出文件名、文件操作方式(读、写或者读写),如果该文件名不存在就意味着建立文件(只对写文件而言,对于读文件就没有这种问题),并将文件指针指向文件的开头。
如果已经有一个同名文件的存在,则删除该文件,如果没有同名文件,则建立该文件,并将文件指针指向文件爱你开头。
fopen(char *filename,char *type);
其中*filename是要打开文件的文件名指针,一般用双引号括起来的文件名表示,也可以使用双反斜杠隔开的路径名。而*type参数表示了对打开文件的操作方式。可以采用的操作方式如下:
方式 含义
"r" 打开,只读
"w" 打开,文件指针指到头,只写
"a" 打开,指向文件尾,在已存在文件中追加
"rb" 打开一个二进制文件,只读
"wb" 打开一个二进制文件,只写
"ab" 打开一个二进制文件,进行追加
"r+" 以读/写方式打开一个已存在的文件
"w+" 以读/写方式建立一个新的文本文件
"a+" 以读/写方式打开一个文件文件进行追加
"rb+" 以读/写方式打开一个二进制文件
"wb+" 以读/写方式建立一个新的二进制文件
"ab+" 以读/写方式打开一个二进制文件进行追加
当使用fopen成功的打开一个文件时,该函数将返回一个FILE指针,如果文件打开失败,则返回一个NULL指针。如果想要打开test文件,进行写:
FILE *fp;
if((fp = fopen("test","w")) == NULL)
{
printf("File cannot be opened\n");
exit();
}
else
{
printf("File opened for writing\n");
}
fclose(fp);
DOS操作系统对同时打开的文件数目是有限制的,缺省值为5,可以通过修改CONFIG.SYS文件改变这个设置。
关闭文件函数fclose()
文件操作完成后,必须使用fclose()函数进行关闭,这是因为对打开的文件进行写入时,如果文件缓冲区的空间没有被写入的内容填满,这些内容不会写到打开的文件中去从而丢失。
只有对打开的文件进行关闭操作时,停留在文件缓冲区的内容才能写到该文件中去,从而使文件完整。再者一旦关闭了文件,该文件对应的FILE结构将被释放,从而使关闭的文件得到保护,因为此时对该文件的存取操作将不会进行。文件的关闭也意味着释放了该文件的缓冲区。
int fclose(FILE *stream);
它表示该函数将关闭FILE指针对应的文件,并返回一个整数值,如果成功的关闭了文件,则返回一个0值,否则返回一个非0值。
if(fclose(fp) != 0)
{
printf("File cannot be closed\n");
exit(1);
}
else
{
printf("File is now closed\n");
}
当打开多个文件进行操作时,而又要同时关闭时,可以采用fcloseall()函数,它将关闭所有在程序中打开的文件。
int fcloseall();
该函数将关闭所有已经打开的文件,将各文件缓冲区未装满的内容写到相应的文件当中去,接着释放这些缓冲区,并返回关闭文件的数目。
n = fcloseall(); //n用来接收关闭文件的数目
标准文件的读写
1)读写文件中的字符,一次只能读写文件当中的一个字符。
int fgetc(FILE *stream);
int fgetchar(void);
int fputc(int ch,FILE *stream);
int fputchar(int ch);
int getc(FILE *stream);
int putc(int ch,FILE *stream);
//fgetc()函数将把流指针指向的文件中的一个字符读出。
int fgetc(FILE *stream);
int ch = fgetc(fp);
把流指针fp指向的文件中的一个字符读出,并赋给ch,当执行fgetc()函数时,当文件指针指到文件末尾,遇到文奸济恶输入EOF,该函数返回一个-1给ch,在程序当中常用检查该函数的返回值是否为-1来判断是否读到文件末尾,从而决定是否继续。
//该函数执行结构,把ch表示的字符送到流指针fp指向的文件当中
putc(ch,fp);
2)读写文件中字符串的函数
char *fgets(char *string,int n,FILE *stream);
char *gets(char *s);
int fprintf(FILE *stream,char *format,variable-list);
int fputs(char *string,FILE *stream);
int fscanf(FILE *stream,char *format,variable-list);
//把由流指针指定的文件中n-1个字符,读到指针stream指向的字符数组中去
fgets(buffer,9,fp);
//将把fp指向的文件中的8个字符读到buffer内存区,buffer可以是定义的字符数组,也可以是动态分配的内存区。
//注意,fgets()函数读到'\n'就停止,而不管是否达到数目要求。同时在读取字符串的最后加上'\0'。
fgets()函数执行结束后,返回一个指向该字符串的指针,如果读到文件末尾或者出错,则均返回一个空指针NULL,所以常用feof()函数来检测是否到了文件的末尾或者是ferror()函数来测试是否出错。
#include "stdio.h"
int main()
{
FILE *fp;
char str[128];
if((fp=fopen("test.txt","r"))==NULL)
{
printf("cannot open file\n");
exit(1);
}
while(!feof(fp))
{
if(fgets(str,128,fp)!=NULL) printf("%s",str);
}
fclose(fp);
}
由于gets()函数,只要没有遇到换行符或者文件结束符,就会一直读下去,因此需要用户控制,否则会造成存储区的溢出
fputs()函数向指定文件写入一个由string指向的字符串,'\0'不写入文件。
fprintf()和fscanf()同printf()和scanf()函数类似,不同之处就是printf()函数是想显示器输出,fprintf()则是向流指针指向的文件输出;fscanf()是从文件输入。
#include<stdio.h>
int main()
{
char *s="That's good news";
int i=617;
FILE *fp;
fp=fopne("test.dat", "w");
fputs("Your score of TOEFLis",fp);
fputc(':', fp);
fprintf(fp, "%d\n", i);
fprintf(fp, "%s", s);
fclose(fp);
}
清除和设置文件缓冲区
1)清除文件缓冲区函数
int fflush(FILE *stream);
int flushall();
fflush()函数将清除由stream指向的文件缓冲区里的内容,常用于写完一些数据后,立即用该函数清除缓冲区,以免误操作时,破坏原来的数据。
flushall()将清除所有打开文件所对应的文件缓冲区。
2)设置文件缓冲区函数
void setbuf(FILE *stream,char *buf);
void setvbuf(FILE *stream,char *buf,int type,unsigned size);
这两个函数将使得打开文件后,用户可建立自己的文件缓冲区,而不使用fopen()函数打开文件设定的默认缓冲区。
对于setbuf()函数,buf指出的缓冲区长度由头文件stdio.h中定义的宏BUFSIZE的值决定,缺省值为512字节。当选定buf为空时,setbuf函数将使的文件I/O不带缓冲。
而对setvbuf函数,则由malloc函数来分配缓冲区。参数size指明了缓冲区的长度(必须大于0),而参数type则表示了缓冲的类型,其值可以取如下值:
type 值 含义
_IOFBF 文件全部缓冲,即缓冲区装满后,才能对文件读写
_IOLBF 文件行缓冲,即缓冲区接收到一个换行符时,才能对文件读写
_IONBF 文件不缓冲,此时忽略buf,size的值,直接读写文件,不再经过文件缓冲区缓冲
文件的随机读写函数
前面介绍的文件的字符/字符串读写,均是进行文件的顺序读写,即总是从文件的开头开始进行读写。这显然不能满足我们的要求,C语言提供了移动文件指针和随机读写的函数,它们是:
1)移动文件指针函数
//用来得到文件指针离文件开头的偏移量。当返回值是-1时表示出错。
long ftell(FILE *stream);
//用于将文件指针移到文件的开头,当移动成功时,返回0,否则返回一个非0值。
int rewind(FILE *stream);
//用于把文件指针以origin为起点移动offset个字节
fseek(FILE *stream,long offset,int origin);
//其中origin指出位置可以有以下几种
origin 数值 代表的具体位置
SEEK_SET 0 文件开头
SEEK_CUR 1 文件指针当前位置
SEEK_END 2 文件尾
//把文件指针从文件开头移到第10字节处,由于offset参数要求是长整型数,故其数后带L。
fseek(fp,10L,0);
//把文件指针从文件尾向前移动15字节。
fseek(fp,-15L,2);
2)文件随机读写函数
//从流指针指定的文件中读取nitems个数据项,每个数据项的长度为size个字节,读取的nitems数据项存入由ptr指针指向的内存缓冲区中,
int fread(void *ptr,int size,int nitems,FILE *stream);
//从ptr指向的缓冲区中取出长度为size字节的nitems个数据项,写入到流指针stream指向的文件中,执行该操作后,文件指针将向后移动,
//移动的字节数等于写入文件的字节数目。该函数操作完成后,也将返回写入的数据项数。
int fwrite(void *ptr,int size,int nitems,FILE *stream);
//在执行fread()函数时,文件指针随着读取的字节数而向后移动,最后移动结束的位置等于实际读出的字节数。该函数执行结束后,将返回实际读出的数据项数,
//这个数据项数不一定等于设置的nitems,因为若文件中没有足够的数据项,或读中间出错,都会导致返回的数据项数少于设置的nitems。
//当返回数不等于nitems时,可以用feof()或ferror()函数进行检查。
非标准文件的读写
这类函数最早用于UNIX操作系统,ANSI标准未定义,但有时也经常用到,DOS 3.0以上版本支持这些函数。它们的头文件为io.h。我们并不常用这些函数,
1)文件的打开和关闭
int open(char *filename, int access);
//该函数表示按access的要求打开名为filename的文件,返回值为文件描述字
//其中access有两部分内容:基本模式和修饰符
// 两者用" "("或")方式连接。修饰符可以有多个, 但基本模式只能有一个
基本模式 含义 修饰符 含 义
--------------------------------------------------------
O_RDONLY 只读 O_APPEND 文件指针指向末尾
O_WRONLY 只写 O_CREAT 文件不存在时创建文件, 属性按基本模式属性
O_RDWR 读写 O_TRUNC 若文件存在, 将其长度缩为0, 属性不变
O_BINARY 打开一个二进制文件
O_TEXT 打开一个文字文件
//open()函数打开成功, 返回值就是文件描述字的值(非负值), 否则返回-1。
int close(int handle);
//close()函数的作用是关闭由open()函数打开的文件
//该函数关闭文件描述字handle相连的文件。
2)读写函数
int read(int handle, void *buf, int count);
//read()函数从handle(文件描述字)相连的文件中, 读取count个字节放到buf所指的缓冲区中
//返回值为实际所读字节数, 返回-1表示出错。返回0 表示文件结束。
int write(int handle, void *buf, int count);
//write()函数把count个字节从buf指向的缓冲区写入与handle相连的文件中,
//返回值为实际写入的字节数。
3)随机定位函数
int lseek(int handle, long offset, int fromwhere);
//该函数对与handle相连的文件位置指针进行定位,功能和用法与fseek()函数相同
long tell(int handle);
//该函数返回与handle相连的文件现生位置指针, 功能和用法与ftell()相同