文章目录
前言
什么是文件
在程序设计中,我们一般谈的文件有两种:程序文件、数据文件。
程序文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀
为.exe)。
数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
这里我们讨论的是数据文件。我们以前所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上的文件。
为什么要使用文件
是为了“持久化”。持久化就是让数据一直持续地存储下去。写入磁盘/文件中就是一个最简单常用的解决方案。
文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。为了方便起见,文件标识常被称为文件名。
文件名包含3部分:文件路径+文件名主干+文件后缀(扩展名)。例如:c:\code\test.txt
扩展名的用处:
1.区分文件的种类。
2.告诉操作系统使用哪个程序来默认打开这个文件。
更准确地说,在系统上,是通过文件的“路径”作为文件的身份标识。
路径又分为绝对路径和相对路径。
例如D:\program2\qq\Bin\QQ(2).exe 就是绝对路径。
若以D:\program2\qq\Bin 作为参考,此时.\QQ(2).exe 就是一个相对路径。因此,相对路径需要给出一个“参考系”,告诉我们要从那个目录出发来找这个文件。
当我们需要使用代码来操作文件的时候,就需要通过文件的路径来指定库函数要操作哪个文件。此处指定相对路径或绝对路径都是可以的。
注意:更推荐使用/而不是反斜杠\,避免转义带来的麻烦。
文件类型
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
PS:记事本是按照文本文件的方式来打开的。jpg、docx、xlsx等都是以二进制的方式打开的。
一、文件的打开与关闭
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
在程序中,若文件使用完毕,一定要关闭文件,否则会导致文件资源泄露/句柄泄露。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件
的关系。
ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。
FILE * fopen ( const char * filename, const char * mode );
int fclose ( FILE * stream );
mode参数如下:
mode |
| 若指定文件不存在 |
---|---|---|
“r”(只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开一个文本文件 | 建立一个新的文件 |
“a”(追加) | 向文本文件尾添加数据 | 出错 |
“rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新的文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 出错 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,新建一个新的文件 | 建立一个新的文件 |
“a+”(读写) | 打开一个文件,在文件尾进行读写 | 建立一个新的文件 |
“rb+”(读写) | 为了读和写打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 建立一个新的文件 |
“ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立一个新的文件 |
下面看一个例子:
FILE* f = fopen("d:/test.txt", "w");
if (f == NULL) {
// printf("文件打开失败! errno = %d, %s\n", errno, strerror(errno));
perror("文件打开失败!");
system("pause");
return 1;
}
printf("文件打开成功!\n");
C的标准库和一些系统函数中,很多函数在执行出错的时候都会把出错的信息设置到errno这个错误码中,然后就可以通过错误码识别出错的原因。
如果程序是对的,此时的errno默认是0。如果是非0,说明上一个操作是出错的。
注意需要引入errno.h头文件。若文件打开失败,fopen返回NULL,可以打印出errno错误码,并且使用strerror(errno)输出错误码对应的解释。为了简化写法,可以直接而使用perror()函数代替,两者是等价的。
这种基于错误码的报错方式,是上世纪的开发方式,现在开发时,会直接抛出异常(Go语言除外)。
如果反复使用fopen打开文件,而没有使用fclose关闭,最终会达到打开文件的数量上限。这个数量是可以配置的。
PS:一个程序在启动的时候,自己默认打开了3个文件——标准输入stdin、标准输出stdout、标准错误stderr。
二、文件的顺序读写
功能 |
| 适用于 |
---|---|---|
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
fread
fread 负责把磁盘上的数据读取到内存中.
FILE* f = fopen("d:/test.txt", "w");
if (f == NULL) {
// printf("文件打开失败! errno = %d, %s\n", errno, strerror(errno));
perror("文件打开失败!");
system("pause");
return 1;
}
printf("文件打开成功!\n");
char buf[1024] = { 0 };
// fread 负责把磁盘上的数据读取到内存中.
// 其中第二个参数和第三个参数相乘, 就得到了要读取的整体的字节数.
// 返回值表示实际读取到的元素个数.
// 如果实际读到的元素个数小于预期的要读的元素个数, 就可以认为
// 文件读完了
int n = fread(buf, 1, 1024, f);
printf("%s\n", buf);
fwrite
fwrite 负责把磁盘上的数据读取到内存中。
char buf[1024] = "hahaha";
// fwrite 负责把内存的数据写到磁盘中
// 如果 fwrite 写成功了, 那么就会返回实际写入的元素个数.
// 如果失败了就会返回 < 0 的结果.
int n = fwrite(buf, 1, strlen(buf), f);
if (n < strlen(buf)) {
perror("fwrite");
}
fprintf和fscanf
// 使用 fprintf 进行格式化写入
int num = 10;
fprintf(f, "num = %d", num);
// 这个操作与 printf 等价.
fprintf(stdout, "num = %d", num);
//这个操作与 scanf 等价.
fscanf(stdin, "");
sprintf和sscanf
这两个函数不直接和文件操作有关,但是非常重要的函数。
sprintf 把格式化的结果写到字符串中。
sscanf 是从格式化字符串中解析结果。
// sprintf / sscanf 是非常重要的函数
char buf[1024] = { 0 };
sprintf(buf, "num = %d", num);
printf("%s\n", buf);
sprintf 和 sscanf 的一个典型用法:
把整数转成字符串,把字符串转成整数。
int num = 10;
// buf 中的内容是一个 "10"
char buf[1024] = { 0 };
// 这个操作不是 "输出", 而是把 int 这个数据, 给放到 char buf[] 数组里了
sprintf(buf, "%d", num);
printf("%c\n", buf[0]);
printf("%c\n", buf[1]);
printf("%c\n", buf[2]);
printf("%s\n", buf);
在 C 语言中,还有一组函数也能实现字符串和整数的转换:
atoi 把字符串,转成整数。
itoa 把整数,转成字符串。
三、文件的随机读写
fseek
fseek可以理解成修改光标(Cursor)的位置。
int fseek ( FILE * stream, long int offset, int origin );
作一个比喻:文件指针FILE*就像一个水管,读写操作均需要通过这根水管来进行,而水池就相当于文件。那么fseek函数可以修改cursor来移动文件指针的位置,来对不同的文件进行操作。
例子:
/* fseek example */
#include <stdio.h>
int main ()
{
FILE * pFile;
pFile = fopen ( "example.txt" , "wb" );
fputs ( "This is an apple." , pFile );
fseek ( pFile , 9 , SEEK_SET );
fputs ( " sam" , pFile );
fclose ( pFile );
return 0;
}
四、文件结束判定
判断文件读取完毕的标志因函数而异。
二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
如fread,第三个参数表示预期要读的元素个数count,返回值表示实际读到的元素个数n。那么若n < count 就认为读完了;若没有读完,一定是 n == count的。
文本文件读取是否结束,判断返回值是否为EOF或者NULL。
fgetc返回EOF(即-1)。
fgets返回NULL表示读取完毕了。
牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。
而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。