注意,请认真学习完《C程序设计(第五版)》第十章后再阅读本文会有更大的收获。
文件
对于普通的电脑使用者来说,文件主要用于存储和读取文字、图片、音视频等。对于C语言的开发者来讲,文件就是存储和读取数据的媒介。
C语言中,文件都是按字节写入的,并在需要的时候按照存储的字节大小来相应的读取,用字节流(stream)来形容是最合适不过了。
那C语言究竟如何对文件进行读写操作的呢?下面来一起学习一下吧!
ASCII文件和二进制文件
ASCII文件里的所有内容都是ASCII字符,比如数字100,分别以'1'、'0'、'0'的ASCII字符形式存储,而一个ASCII字符占一个字节,所以100存储在ASCII文件里占用3个字节。
上述情况如果存储在二进制文件中就可以100这个整数的形式存储,通常占用4个字节。我们来测试一下,下图中两个文件都保存了三个数字1、10、100,上面是ASCII文件占用6个字节,下面是二进制文件占用3*4=12个字节。
ASCII完全是按照字符表现形式存储的,而二进制则是按照内存中数据存储的形式存储的;ASCII文件里面的内容对人来说很友好,直接能读懂,而二进制文件需要知道存储的数据到底是什么才能解析,因为数据在内存中占用的字节数是不固定的。
ASCII可以理解为按照“字符表象”存储,二进制则是照搬“值在内存中的存储方式”存储。
文件与指针
C语言中定义了文件在内存中的存储信息为一个结构体,叫作FILE。我们通常操作文件的时候会定义一个指向这个文件结构体数据类型的指针变量,如FILE *fp;
打开文件
在Visual Studio 2022里,使用fopen_s()函数替代了原来的fopen()函数来打开文件。
fopen_s()不再返回文件系统的指针,而是作为第一个参数传入,如:
FILE *fp;
errno_t err = fopen_s(&fp, "binary.file", "wb");
关闭文件
关闭一个打开的文件使用fclose()函数。由于C语言缓冲区读写文件的特性,尤其是向文件写入数据时,不关闭文件会导致缓冲区(未满时)最后的内容无法保存到文件中去。
文件指针偏移
-
rewind()函数重置指针至文件开头的位置
-
fseek()函数将指针基于字节的长度移动到到某个位置
-
ftell()函数返回指针相对于文件开头位置的偏移量
ASCII文件写入与读取
写入单个字符
使用fputc()函数写入单个字符,用putc()函数也是同样的作用,是等价的。但是比较名字向文件写入的时候用fputc(),向控制台stdout写入时用putc(),这样让代码被阅读的时候更友好一些。
写入字符串
使用fputs()函数直接写入字符串,但是注意和上面的区别,它和puts()函数不是等价关系,puts()是向控制台stdout写入。
static void fun11() {
FILE *fp;
errno_t err;
err = fopen_s(&fp, "char.file", "w");
if (err == 0 && fp){
printf("--ok--%d\n", err);
// 单个字符输入
fputc('a', fp);
fputwc(L'x', fp);
putc('v', fp);
// 字符串输入
fputs("\nhello world\n", fp);
fputs("你好\n", fp);
fputws(L"how do you do\n", fp);
fprintf(fp, "err is %d\n", err);
fclose(fp);
} else{
printf("--error--%d\n", err);
}
}
读取
文件读取可以使用fgetc()函数按照ASCII字符逐个读取,也可以使用fgets()按行读取。
static void fun12() {
FILE *fp;
errno_t err;
err = fopen_s(&fp, "char.file", "r");
if (err == 0 && fp){
printf("\n======使用fgets()读取文件========\n");
while (!feof(fp)){
char str[3];
fgets(str, sizeof(str), fp);
printf("%s", str);
}
printf("\n======使用fgetc()读取文件========\n");
rewind(fp);
while (!feof(fp)){
printf("%c", fgetc(fp));
}
printf("\n");
fclose(fp);
}
}
注意,以上示例中fgets()实际每次读取长度为49,因为末位要给“\0”留着。
二进制文件写入与读取
写入
二进制文件写入通常使用fwrite()函数。
static void fun1() {
FILE *fp;
errno_t err = fopen_s(&fp, "binary.file", "wb");
if (err == 0 && fp){
int *num = malloc(sizeof(int));
if (!num){
return;
}
*num = 1;
fwrite(num, sizeof(int), 1, fp);
*num = 10;
fwrite(num, sizeof(int), 1, fp);
*num = 100;
fwrite(num, sizeof(int), 1, fp);
fclose(fp);
}
}
读取
对应写入的读取函数通常使用fread(),读取的参数要根据写入数据的字节大小来确定,否则读取出来的数据就是错误的。
static void fun2() {
FILE *fp;
errno_t err = fopen_s(&fp, "binary.file", "rb");
if (err == 0 && fp){
int *num = malloc(sizeof(int));
if (!num){
return;
}
printf("\n======使用fread()读取文件========\n");
size_t size;
while ((size = fread(num, sizeof(int), 1, fp)) > 0){
printf("%d, size is %d, ftell is %d\n", *num, (int) size, ftell(fp));
}
printf("\n");
fclose(fp);
}
}
fread()和feof()
fread()函数读取数据时不要使用feof()来判断是否读完,因为fread()是“成块”读取数据的,读到最后一块时feof()仍未到末尾,接着fread()继续读取一次feof()才判断到了结尾,这样会导致末尾重复读取一次。
总结
如果我们掌握了文件的读写操作,按道理来讲在不考虑效率的前提下可以做一个简单的文件数据库了,有兴趣的可以试试实现最基础的增删改查功能。
按照《C程序设计》第五版的书本知识章节来说,本节课过后就完结了,从9月19开始刚好一个月的时间,在坚持完成这系列课程的同时,我自己也感觉到了进步,毕竟现代高级语言学多了,会更有想去了解底层的冲动,刚好C语言能辅助拓展自己的一些知识面。
尽管书本章节学习完了,基础知识都过了一遍,但想真正的掌握C语言只有一条道——实践,接下来准备从GUI项目开发为切入点来巩固加深C语言,到时候也会更新在个人媒体上。
尽管目前阅读量和粉丝都很少,中途确实有打退堂鼓的想法,但是最终还是坚持了下来,也算是给自己一个交代吧。
Anyway,无论是何机缘你读到了本系列课程,都希望对你有那么一点帮助。本系列课程是针对初学者特别是在校大学生的,希望大家能学好C语言!