😜一、什么是文件
计算机文件,属于文件的一种,与普通文件载体不同,这类文件是以硬盘为载体存储在计算机上的信息集合。
在程序设计中,我们一般谈的文件有两种:程序文件、数据文件。
♈文件分类:
文件一般讲两种:程序文件和数据文件;
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
包括程序运行时所读写的数据。本篇所涉及的就是数据文件。
♉-文件名
一个文件要有一个唯一的文件标识,而文件名也正是文件存在的标识,操作系统根据文件名来对其进行控制和管理。文件名的存在以便用户识别和引用。
⚡文件名包含3部分:文件路径 + 文件名主干 + 文件后缀
例如:c:\code\test\test.txt
文件路径: c:\code\test\ 文件名主干: test 文件后缀: .txt
♊文件类型
根据数据的组织形式,数据文件可分为: 文本文件 和 二进制文件
1、文本文件
基于字符编码,常见编码有ASCII、UNICODE等
一般可以使用文本编辑器直接打开
数5678的以ASCII存储形式(ASCII码)为:
00110101 00110110 00110111 00111000
2、二进制文件
基于值编码,自己根据具体应用,指定某个值是什么意思
把内存中的数据按其在内存中的存储形式原样输出到磁盘上
数5678的存储形式(二进制码)为:
00010110 00101110
👉注意:字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
👽例如:
有整数100,如果以ASCII码的形式输出到磁盘,则磁盘中占用3个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(数据在内存当中以二进制形式存储)。
♋文件缓冲区
- ANSI C标准采用“缓冲文件系统”处理数据文件。
- 所谓缓冲文件系统是指系统自动地在内存区为程序中每一个正在使用的文件开辟一个文件缓冲区从内存向磁盘输出数据必须先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘去。
- 如果从磁盘向计算机读入数据,则一次从磁盘文件将一批数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(给程序变量) 。
#include <stdio.h> #include <windows.h> int main() { FILE* pf = fopen("test.txt", "w"); fputs("abcdef", pf);//此时只是将数据放到了缓冲区当中 printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n"); Sleep(10000); printf("刷新缓冲区\n"); fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到了磁盘当中 printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n"); Sleep(10000); //fclose在关闭文件的时候也会刷新缓冲区 fclose(pf); pf = NULL; return 0; }
此代码可自行验证,fputs函数执行完后打开test.txt文件,你会发现没有任何数据,当刷新缓冲区后数据就会出现在test,txt文件里。
☝小知识点
int fflush(FILE *stream);
功能:更新缓冲区,让缓冲区的数据立马写到文件中。
fflush函数就可以认为是一个紧急事件。
👉注:因为缓冲区的存在。C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束时关闭文件。若不做,可能会导致读写文件的问题。
😤二、文件操作
🍏1.文件的使用
文件的操作一般分三步:1.打开文件; 2.读/写; 3.关闭文件;
🍎2.文件指针
💊 缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名FILE。typedef struct { short level; //缓冲区"满"或者"空"的程度 unsigned flags; //文件状态标志 char fd; //文件描述符 unsigned char hold; //如无缓冲区不读取字符 short bsize; //缓冲区的大小 unsigned char *buffer;//数据缓冲区的位置 unsigned ar; //指针,当前的指向 unsigned istemp; //临时文件,指示器 short token; //用于有效性的检查 }FILE;
- FILE是系统使用typedef定义出来的有关文件信息的一种结构体类型,结构中含有文件名、文件状态和文件当前位置等信息
- 声明FILE结构体类型的信息包含在头文件“stdio.h”中,一般设置一个指向FILE类型变量的指针变量,然后通过它来引用这些FILE类型变量。通过文件指针就可对它所指的文件进行各种操作
💦创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
pf是一个指向FILE类型数据的指针变量,通过pf指针可以指向某个文件的文件信息区(FILE结构体变量),而文件信息区就包含着 test.txt 文件的具体细节,也可以说是文件信息区的内容是描述该文件的。
📅 扩展:
C语言中有三个特殊的文件指针由系统默认打开,用户无需定义即可直接使用:
stdin
:标准输入,默认为当前终端(键盘),我们使用的scanf、getchar函数默认从此终端获得数据
stdout
: 标准输出,默认为当前终端(屏幕),我们使用的printf、puts函数默认输出信息到此终端
stderr
: 标准出错,默认为当前终端(屏幕),我们使用的perror函数默认输出信息到此终端
🍊3.文件打开与关闭
文件的打开与关闭都有相应的函数,fopen()与fclose()是成对出现的,上文也提到了若刷新缓冲区或者在文件操作结束时未关闭文件,就会导致出现读写文件的问题。在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
FILE * fopen ( const char * filename, const char * mode );
功能:打开文件
🐬参数:
filename:需要打开的文件名,根据需要加上路径
mode:打开文件的模式设置
🐠返回值:
成功:文件指针
失败:NULL
int fclose(FILE * stream);
功能:关闭先前fopen()打开的文件。此动作让缓冲区的数据写入文件中,并释放系统所提供的文件资源。
🎭参数:
stream:文件指针
🎭返回值:
成功:0
失败:-1
⛲打开文件的第一个参数的几种形式
FILE *fp_passwd = NULL;
//相对路径:
//打开当前目录passdw文件:源文件(源程序)所在目录
FILE *fp_passwd = fopen("passwd.txt", "r");
//打开当前目录(test)下passwd.txt文件
fp_passwd = fopen(". / test / passwd.txt", "r");
//打开当前目录上一级目录(相对当前目录)passwd.txt文件
fp_passwd = fopen(".. / passwd.txt", "r");
//绝对路径:
//打开C盘test目录下一个叫passwd.txt文件
fp_passwd = fopen("c:/test/passwd.txt","r");
🌌打开文件的第二个参数(打开文件的方式)
文件打开方式 含义 若指定文件不存在 “r”(只读) 为了输入数据,打开一个已经存在的文本文件 出错 “w”(只写) 为了输出数据,打开一个文本文件 建立一个新的文件 “a”(追加) 向文本文件尾添加数据 出错 “rb”(只读) 为了输入数据,打开一个二进制文件 出错 “wb”(只写) 为了输出数据,打开一个二进制文件 建立一个新的文件 “ab”(追加) 向一个二进制文件尾添加数据 出错 “r+”(读写) 为了读和写,打开一个文本文件 出错 “w+”(读写) 为了读和写,建议一个新的文件 建立一个新的文件 “a+”(读写) 打开一个文件,在文件尾进行读写 建立一个新的文件 “rb+”(读写) 为了读和写打开一个二进制文件 出错 “wb+”(读写) 为了读和写,新建一个新的二进制文件 建立一个新的文件 “ab+”(读写) 打开一个二进制文件,在文件尾进行读和写 建立一个新的文件
🚥注意:
b是二进制模式的意思,b只是在Windows有效,在Linux用r和rb的结果是一样的
Unix和Linux下所有的文本文件行都是\n结尾,而Windows所有的文本文件行都是\r\n结尾
在Windows平台下,以“文本”方式打开文件,不加b:
n 当读取文件的时候,系统会将所有的 "\r\n" 转换成 "\n"
当写入文件的时候,系统会将 "\n" 转换成 "\r\n" 写入
n 以"二进制"方式打开文件,则读写都不会进行这样的转换
在Unix/Linux平台下,“文本”与“二进制”模式没有区别,"\r\n" 作为两个字符原样输入输出
int main() { FILE *fp = NULL; // "\\"这样的路径形式,只能在windows使用 // "/"这样的路径形式,windows和linux平台下都可用,建议使用这种 // 路径可以是相对路径,也可是绝对路径 fp = fopen("../test", "w"); // fp = fopen("..\\test", "w"); if(fp == NULL) { //perror()是标准出错打印函数,能打印调用库函数出错原因 perror("open"); return -1; } fclose(fp); //关闭文件 fp = NULL; return 0; }
🍋4.文件的顺序读写
功能 | 函数名 | 适用于 |
---|---|---|
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
🌎按照字符读写文件fgetc、fputc
******************************** 1.写文件 *****************************************
#include <stdio.h> int fputc(int ch, FILE * stream);
功能:将ch转换为unsigned char后写入stream指定的文件中
🐬参数:
ch:需要写入文件的字符
stream:文件指针
🐬返回值:
成功:成功写入文件的字符
失败:返回-1
//将26个英文字母输出到test.txt文件中 #include <stdio.h> int main() { FILE* pf = (FILE*)fopen("test.txt", "w"); if (pf==NULL) { perror("fopen"); return -1; } for (int i = 0; i < 26; i++) { fputc('a'+i, pf); } fclose(pf); pf=NULL; return 0; }
******************************** 2.文件结尾 *****************************************
feof函数既可用以判断二进制文件又可用以判断文本文件
#include <stdio.h> int feof(FILE * stream);
功能:检测是否读取到了文件结尾。判断的是最后一次“读操作的内容”,不是当前位置内容(上一个内容)。
🐬参数:
stream:文件指针
🐬返回值:
非0值:已经到文件结尾
0:没有到文件结尾
注: 在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
******************************** 3.读文件 *****************************************
#include <stdio.h> int fgetc(FILE * stream);
功能:从stream指定的文件中读取一个字符
🐬参数:
stream:文件指针
🐬返回值:
成功:返回读取到的字符
失败:-1
#include <stdio.h> int main() { char ch; #if 0 while((ch = fgetc(fp)) != EOF) { printf("%c", ch); } printf("\n"); #endif while(!feop(fp)) //文件没有结束,则执行循环 { ch = fgetc(fp); printf("%c", ch); }; printf("\n"); }
🌖 按照行读写文件 fgets、fputs
******************************** 1.写文件 *****************************************
#include <stdio.h> int fputs(const char * str, FILE * stream);
功能:将str所指定的字符串写入到stream指定的文件中,字符串结束符 '
\0
' 不写入文件。🐬参数:
str:字符串
stream:文件指针
🐬返回值:
成功:0
失败:-1
#include <stdio.h> int main() { FILE* pf = (FILE*)fopen("test.txt", "w"); if (pf==NULL) { perror("fopen"); return -1; } char *buf[] = { "123456\n", "bbbbbbbbbb\n", "ccccccccccc\n" }; int i = 0; int n = 3; for (i = 0; i < n; i++) { int len = fputs(buf[i], pf); printf("len = %d\n", len); } fclose(pf); pf=NULL; return 0; }
******************************** 2.读文件 *****************************************
#include <stdio.h> char * fgets(char * str, int size, FILE * stream);
功能:从stream指定的文件内读入字符,保存到str所指定的内存空间,直到出现换行字符、读到文件结尾或是已读了size - 1个字符为止,最后会自动加上字符 '\0' 作为字符串结束。
🐟参数:
str:字符串
size:指定最大读取字符串的长度(size - 1)
stream:文件指针
🐟返回值:
成功:成功读取的字符串(str)
读到文件尾或出错: NULL
#include <stdio.h> int main() { FILE* pf = (FILE*)fopen("test.txt", "r"); if (pf==NULL) { perror("fopen"); return -1; } char arr[10] = { 0 }; char *p = fgets(arr, 7, pf); if(p != NULL) { printf("%s", arr); } fclose(pf); pf=NULL; return 0; }
🌗按照格式化文件fprintf、fscanf
******************************** 1.写文件 *****************************************
#include <stdio.h> int fprintf(FILE * stream, const char * format, ...);
功能:根据参数format字符串来转换并格式化数据,然后将结果输出到stream指定的文件中,指定出现字符串结束符 '\0' 为止。
🐟参数:
stream:已经打开的文件
format:字符串格式,用法和printf()一样
🐟返回值:
成功:实际写入文件的字符个数
失败:-1
通常用在结构体比较多 例如:#include <stdio.h> int main() { FILE* pf = (FILE*)fopen("test.txt", "w"); if (pf==NULL) { perror("fopen"); return -1; } fprintf(pf, "%s %d", "zhuxu", 115); fclose(pf); pf = NULL; return 0; }
******************************** 2.读文件 *****************************************#include<stdio.h> typedef struct S { char name[10]; int age; }Peo; int main() { FILE* pf = fopen("test.txt", "w"); if (pf != NULL) { Peo p = { "zhangsan", 18 }; fprintf(pf, "%s %d\n", p.name, p.age); fclose(pf); pf = NULL; } return 0; }
#include <stdio.h> int fscanf(FILE * stream, const char * format, ...);
功能:从stream指定的文件读取字符串,并根据参数format字符串来转换并格式化数据。
🐙参数:
stream:已经打开的文件
format:字符串格式,用法和scanf()一样
🐙返回值:
成功:参数数目,成功转换的值的个数
失败: - 1
读取文件信息到结构体变量中:#include<stdio.h> typedef struct S { char name[10]; int age; }Peo; int main() { FILE* pf = fopen("test.txt", "r"); if (pf != NULL) { Peo p = { 0 }; fscanf(pf, "%s %d", p.name, &p.age); printf("%s %d", p.name, p.age); fclose(pf); pf = NULL; } return 0; }
🌘按照块读写文件fread、fwrite(二进制)
******************************** 1.写文件 *****************************************
#include <stdio.h> size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);
功能:以数据块的方式给文件写入内容
🐳参数:
ptr:准备写入文件数据的地址
size: size_t 为 unsigned int类型,此参数指定写入文件内容的块数据大小
nmemb:写入文件的块数,写入文件数据总大小为:size * nmemb
stream:已经打开的文件指针
🐳返回值:
成功:实际成功写入文件数据的块数目,此值和 nmemb 相等
失败:0
#include<stdio.h> #include<string.h> #include<errno.h> typedef struct S { char name[10]; int age; }Peo; int main() { FILE* pf = fopen("test.txt", "wb+"); //二进制写 if (pf != NULL) { Peo p = { "lisi", 19}; fwrite(&p, sizeof(Peo), 1, pf); fclose(pf); pf = NULL; } return 0; }
******************************** 2.读文件 *****************************************
#include <stdio.h> size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);
功能:以数据块的方式从文件中读取内容
🐳参数:
ptr:存放读取出来数据的内存空间
size: size_t 为 unsigned int类型,此参数指定读取文件内容的块数据大小
nmemb:读取文件的块数,读取文件数据总大小为:size * nmemb
stream:已经打开的文件指针
🐳返回值:
成功:实际成功读取到内容的块数,如果此值比nmemb小,但大于0,说明读到文件的结尾。
失败:0
0: 表示读到文件结尾。(feof())
二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
#include<stdio.h> typedef struct S { char name[10]; int age; }Peo; int main() { FILE* pf = fopen("test.txt", "rb+"); if (pf != NULL) { Peo p = { 0 }; fread(&p, sizeof(Peo), 1, pf); //第三个参数表示整个结构体大小 printf("%s %d\n", p.name, p.age); fclose(pf); pf = NULL; } return 0; }
小技巧: 可用返回值来判断是否读完结构体的数据,做循环的判断条件
while (fread(&temp, sizeof(PeoInfo), 1, fp) == 1)
🌑文件的随机读写
******************************** 1. fseek函数 *****************************************
#include <stdio.h> int fseek(FILE *stream, long offset, int whence);
功能:移动文件流(文件光标)的读写位置。
🐤参数:
stream:已经打开的文件指针
offset:根据whence来移动的位移数(偏移量),可以是正数,也可以负数,如果正数,则相对于whence往右移动,如果是负数,则相对于whence往左移动。如果向前移动的字节数超过了文件开头则出错返回,如果向后移动的字节数超过了文件末尾,再次写入时将增大文件尺寸。
whence:其取值如下:
SEEK_SET:从文件开头移动offset个字节
SEEK_CUR:从当前位置移动offset个字节
SEEK_END:从文件末尾移动offset个字节
🐤返回值:
成功:0
失败:-1
#include<stdio.h> #include<string.h> #include<errno.h> int main() { FILE* pf = fopen("test.txt", "r"); if (pf == NULL) { printf("%s\n", strerror(errno)); return; } //开始多次读取 //定位指针:比如要读取从头开始向后偏移 2 个单位的一个字符 fseek(pf, 2, SEEK_SET); int ch = fgetc(pf); printf("%c\n", ch); //第二次读取:要拿到当前文件指针所处位置向后偏移5个单位的字符 fseek(pf, 5, SEEK_CUR); ch = fgetc(pf); printf("%c\n", ch); //第三次读取:要拿到文件流末尾向前偏移8个单位的一个字符 fseek(pf, -8, SEEK_END); ch = fgetc(pf); printf("%c\n", ch); fclose(pf); pf = NULL; return 0; }
特别说明:
在每使用完一次fseek函数后,文件指针会自动向后移动一位:
******************************** 2. ftell函数*****************************************
#include <stdio.h> long ftell(FILE *stream);
功能:获取文件流(文件光标)的读写位置。
🐥参数:
stream:已经打开的文件指针
🐥返回值:
成功:当前文件流(文件光标)的读写位置
失败:-1
//计算test.txt文件里的数据长度 #include <stdio.h> int main () { long size; FILE *pf = fopen ("test.txt","r"); if (pf == NULL) { perror("fopen"); return -1; } else { fseek (pFile, 0, SEEK_END); // non-portable size=ftell (pFile); fclose (pFile); printf ("Size of myfile.txt: %ld bytes.\n",size); } return 0; }
******************************** 3.rewind函数*****************************************
#include <stdio.h> void rewind(FILE *stream);
功能:把文件流(文件光标)的读写位置移动到文件开头。
🐣参数:
stream:已经打开的文件指针
🐣返回值:
无返回值
#include <stdio.h> int main () { int n; char buffer [27]; FILE* pf = fopen ("test.txt","w+"); for ( n='A' ; n<='Z' ; n++) { fputc ( n, pf ); } rewind (pf); fread (buffer,1,26,pf ); fclose (pf); buffer[26]='\0'; puts (pf); return 0; }
🌒文件结束判定
👉文本文件读取是否结束,判断返回值是否为EOF (fgetc),或者NULL(fgets)
- fgetc判断是否为EOF.
- fgets判断返回值是否为NULL.
注: 在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
☝二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
fread判断返回值是否小于实际要读的个数。
文本文件正确判定
#include <stdio.h> #include <stdlib.h> int main() { int c; // 注意:int,非char,要求处理EOF FILE* fp = fopen("test.txt", "r"); if (pf == NULL) { perror("fopen"); return -1; } //fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环 { putchar(c); } //判断是什么原因结束的 if (ferror(fp)) puts("I/O error when reading"); else if (feof(fp)) puts("End of file reached successfully"); fclose(fp); fp = NULL; return 0; }
二进制文件正确判定
#inlcude <stdio.h> int main(void) { double a[5] = {1.0,2.0,3.0,4.0,5.0}; double b = 0.0; size_t ret_code = 0; FILE *fp = fopen("test.txt", "wb"); // 必须用二进制模式 fwrite(a, sizeof(*a), 5, fp); // 将 a 数的元素写到test.txt文件中 fclose(fp); fp = fopen("test.txt","rb"); // 将 a 数组的元素读到变量 b 中,返回值为读取数据的个数 while((ret_code = fread(&b, sizeof(double), 1, fp))>=1) { printf("%lf\n",b); } if (feof(fp)) printf("Error reading test.bin: unexpected end of file\n"); else if (ferror(fp)) { perror("Error reading test.bin"); } fclose(fp); fp = NULL; return 0; }