C语言文件操作
什么是文件?
磁盘上的文件一般都叫文件。
而在程序设计中,我们一般说的文件有两种:
(1) 程序文件:源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀
为.exe)。
(2) 数据文件:文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件,文本文件(后缀为.txt)等。
这里,我们主要讨论的文件类型是数据文件。
在以前的学习中,我们所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。这样做,本次所处理的数据在下一次程序运行时并不会得到保存。
所以当我们把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,可以利用文件保存数据,这里处理的就是磁盘上文件。
(一)文件名
文件名包含三部分:文件路径+文件名主干+文件后缀
例如: c:\code\test.txt
为了方便起见,文件标识常被称为文件名。
(二)文件类型
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
二进制文件:数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
文本文件:如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
数据在内存中的存储形式:
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
(三)文件缓冲区
ANSIC标准采用“缓冲文件系统”处理数据文件,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的
(三)文件指针
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE。
在VS2013中对FILE转到定义。我们可以很清晰的看到FILE其实是一个结构体变量。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
创建一个FILE*类型的指针变量:
FILE* pf;
pf是一个指向FILE类型数据的指针变量,可以通过pf指向某个文件的文件信息区(是一个结构体变量)来访问该信息区中的信息,因此找到该文件。
所以,通过文件指针变量可以找到与它关联的文件。
如图所示:
(四)文件的打开和关闭
打开文件的时候会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC规定使用fopen函数来打开文件,fclose来关闭文件。
FILE *fopen( const char *filename, const char *mode );
int fclose( FILE *stream );
打开方式如下:
文件使用方式 | 含义 | 如果指定文件不存在 |
---|---|---|
“r”(只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开一个文本文件 | 建立一个新的文件 |
“a”(追加) | 向文本文件尾添加数据 | 出错 |
“rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新的文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 出错 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,建立一个新的文件 | 建立一个新的文件 |
“a+”(读写) | 打开一个文件,在文件尾进行读写 | 建立一个新的文件 |
“rb+”(读写) | 为了读和写,打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 建立一个新的文件 |
“ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立一个新的文件 |
int main()
{
//打开文件
//pf是维护文件信息区的指针
FILE* pf = fopen("test.txt", "w");//返回的是结构体(文件信息区)的地址
if (pf == NULL)
{
perror("fopen:");
return 1;//异常
}
fputc('a', pf);//有一个文件指针随着我们写的这个操作而逐渐移动
fclose(pf);
pf = NULL;
return 0;
}
(五)文件的顺序读写
功能 | 函数名 | 适用于 |
---|---|---|
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
fgetc和fputc简单实现文本的拷贝:
int main()
{
FILE* pfRead = fopen("test1.txt", "r");
if (pfRead == NULL)
{
perror("open file for reading:");
return -1;
}
FILE* pfWrite = fopen("test2.txt", "w");
if (pfWrite == NULL)
{
perror("open file for writing:");
fclose(pfRead);//因为第一个文件打开成功了 要记得关闭
pfRead = NULL;
return -1;
}
//拷贝
int ch = 0;
//是整型的原因:fgetc这个函数返回的是字符的ASCII值,放到int里没问题
// EOF的值是-1,所以可以与其比较
while (ch = fgetc(pfRead) != EOF)
{
fputc(ch, pfWrite);
}
//关闭
fclose(pfRead);
fclose(pfWrite);
pfRead = NULL;
pfWrite = NULL;
return 0;
}
fread和fwrite的使用举例和说明:
size_t fread( void *buffer, size_t size, size_t count, FILE *stream );
从给定输入流stream读取最多count个对象到数组buffer中(相当于对每个对象调用size次fgetc),把buffer当作unsigned char数组并顺序保存结果。
返回成功读取的对象个数,若出现错误或到达文件末尾,则可能小于count。
size_t fwrite( const void buffer, size_t size, size_t count, FILEstream );
文件处理函数。向指定的文件中写入若干数据块,如成功执行则返回实际写入的数据块数目
使用示例(文本文件):
struct Stu
{
char name[20];
int age;
float score;
};
//文件的随机读写
int main()
{
struct Stu s = { "张三", 20, 99.5f };
FILE* pf = fopen("text.dat", "wb");// 为了输出数据,打开一个二进制文件
if (pf == NULL)
{
perror("open the file for writting");
return 1;
}
//写文件
fwrite(&s, sizeof(struct Stu), 1, pf);//1代表一个结构体变量
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
int main()
{
struct Stu s = { 0 };
FILE* pf = fopen("text.dat", "rb");// 为了输出数据,打开一个二进制文件
if (pf == NULL)
{
perror("open the file for reading");
return 1;
}
//读文件
fread(&s, sizeof(struct Stu), 1, pf);//返回值size_t表示真实的读到了几个
printf("%s %d %f\n", s.name, s.age, s.score);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
使用示例(二进制文件):
int main(void)
{
double a[5] = {1.0,2.0,3.0,4.0,5.0};
double b = 0.0;
size_t ret_code = 0;
FILE *fp = fopen("test.bin", "wb"); // 必须用二进制模式
fwrite(a, sizeof(*a), SIZE, fp); // 写 double 的数组
fclose(fp);
fp = fopen("test.bin","rb");
// 读 double 的数组
while((ret_code = fread(&b, sizeof(double), 1, fp))>=1)
{
printf("%lf\n",b);
}
if (feof(fp))
printf("Error reading test.bin: unexpected end of file\n");
else if (ferror(fp)) {
perror("Error reading test.bin");
}
fclose(fp);
fp = NULL;
}
fscanf和fprintf的使用举例和说明:
int fprintf( FILE *stream, const char *format [, argument ]…);
根据指定的格式(format),向输出流(stream)写入数据(argument)
int fscanf( FILE *stream, const char *format [, argument ]… );
从一个流中执行格式化输入,fscanf遇到空格和换行时结束,注意空格时也结束。这与fgets有区别,fgets遇到空格不结束。
使用示例:
struct Stu
{
char name[20];
int age;
float score;
};
```c
int main()
{
struct Stu s = { "zhangsan", 20, 66.5f };
FILE* pf = fopen("text.txt", "w");
if (pf == NULL)
{
perror("fopen");
return -1;
}
//格式化数据
fprintf(pf, "%s %d %f", s.name, s.age, s.score); //fprintf 参数 - 可变参数
//把这些写入文件中
fclose(pf);
pf = NULL;
return 0;
}
int main()
{
struct Stu s = { 0 };
FILE* pf = fopen("text.txt", "r");
if (pf == NULL)
{
perror("fopen");
return -1;
}
//格式化数据 - 有格式
fscanf(pf, "%s %d %f", s.name, &(s.age), &(s.score)); //从文件中读出来,放到变量s里
printf("%s %d %f", s.name, s.age, s.score);
fclose(pf);
pf = NULL;
return 0;
}
fscanf和fprintf的使用举例和说明:
int sprintf( char *buffer, const char *format [, argument] … );
把格式化的数据写入某个字符串中。
int sscanf( const char *buffer, const char *format [, argument ] …);
读取格式化的字符串中的数据。
使用示例:
struct Stu
{
char name[20];
int age;
float score;
};
int main()
{
struct Stu s = { "zhangsan", 20, 66.5f };
struct Stu tmp = { 0 };
char str[100] = { 0 };
sprintf(str, "%s %d %f", s.name, s.age, s.score);//可以把这些都转换成一个字符串储存到str里
printf("%s", str);
sscanf(str, "%s %d %f", tmp.name, &(tmp.age), &(tmp.score));//把str里面的东西格式化的存储到tmp中
printf("%s %d %f", tmp.name, tmp.age, tmp.score);
return 0;
}
对比三组函数:
- scanf和printf:我们只能在标准输入流中读取,标准输出流中输出(屏幕上输出,键盘上输入)。scanf针对键盘,printf针对屏幕。
- fscanf和fprintf:fscanf是从文件中可以读取信息,也可以针对键盘读取,针对所有输入流的格式化输入语句。fprintf是针对所有输出流的格式化输出语句。
- sscanf和sprintf:sscanf - 从一个字符串里面提取一个结构化的数据
sprintf - 把一个结构化的数据转化为字符串。
(五)文件的随机读写
fseek函数:重定位流(数据流/文件)上的文件内部位置指针
int fseek( FILE *stream, long offset, int origin );
参数origin(文件指针的位置):
- seek_set 文件开始位置
- seek_cur 文件当前位置
- seek_end 文件末尾位置
使用举例:
int main()
{
FILE * pFile;
pFile = fopen("example.txt", "wb");
if (pFile == NULL)
{
perror("fopen:");
return 1;
}
fputs("This is an apple.", pFile);
fseek(pFile, 9, SEEK_SET);
fputs(" sam", pFile);
fclose(pFile);
return 0;
}
运行后,目标文本文件里的内容如图所示:
ftell函数:返回文件指针相对于起始位置的偏移量,利用函数 ftell() 能方便地知道一个文件的长。
long ftell( FILE *stream );
使用举例(求文件的长):
int main()
{
FILE * pFile;
long size;
pFile = fopen("myfile.txt", "rb");
if (pFile == NULL)
{
perror("Error opening file");
}
fseek(pFile, 0, SEEK_END); //将文件指针置于最末
size = ftell(pFile);
fclose(pFile);
printf("Size of myfile.txt: %ld bytes.\n", size);
return 0;
}
rewind函数:让文件指针的位置回到文件的起始位置。
void rewind ( FILE * stream );
int main()
{
int n = 0;
FILE* pf;
char buffer[27];
pf = fopen("example.txt", "w+");
for (n = 'A'; n <= 'Z'; n++)
{
fputc(n, pf);
}
rewind(pf);//让文件指针的位置回到文件的起始位置
fread(buffer, 1, 26, pf);//从pf指向的流里的第一个字母开始,读到数组buffer中
fclose(pf);//关闭文件
buffer[26] = '\0';
puts(buffer);//将字符数组buffer输出到屏幕上
return 0;
}
(六)文件结束判定
feof函数:检测流上的文件结束符。
int feof( FILE *stream );
并不是用来判断文件是否结束。而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
文件结束:返回非0值;文件未结束:返回0值
- 文本文件读取是否结束:
fgetc判断返回值是否为EOF.;fgets判断返回值是否为NULL。 - 二进制文件的读取结束判断:
fread判断返回值是否小于实际要读的个数。
ferror函数:在调用各种输入输出函数(如 putc.getc.fread.fwrite等)时,如果出现错误,除了函数返回值有所反映外,还可以用ferror函数检查。
int ferror(FILE *stream);
使用示例:
int main()
{
int c; //是整型的原因:1.fgetc这个函数返回的是字符的ASCII值,放到int里没问题
// 2.EOF的值是-1,所以可以与其比较
FILE* fp = fopen("test.txt", "r");
if(fp == NULL) {
perror("File opening failed");
return 1;
}
//fgetc 当读取失败或遇到文件结束的时候,都会返回EOF(-1)
while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
{
putchar(c);
}
//判断是什么原因结束的
if (ferror(fp))
puts("I/O error when reading");
else if (feof(fp))
puts("End of file reached successfully");
fclose(fp);
}