目录
前言:要开始学习文件操作了呢,がんばって!
这里是cool fire,一起加油吧!
A.为什么使用文件
前面学习结构体时,写了通讯录的程序,当通讯录运行起来的时候,可以给通讯录中增加,删除数据,此时数据是存放在内存中,当程序退出的时候,通讯录中的数据自然就不存在了,等下次运行通讯录程序的时候,数据有得重新录入,如果使用这用的通讯录就很难受
我们在想既然是通讯录就应该把信息记录下来,只有我们自己选择删除数据的时候,数据才不复存在。这就涉及到了数据持久化的问题,我们一般数据持久化的方法有,把数据存放在磁盘文件,存放到数据库等方式
使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化。
B.什么是文件
磁盘上的文件就是文件
但是在程序设计中,我们一般谈的文件有两种:程序文件,数据文件(从文件功能的角度来分类的)。
1.程序文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)
2.数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件
我们主要讨论数据文件
以前个各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上
3.文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用
文件名包含3部分:文件路径+文件名主干+文件后缀
例如:c:\code\test.txt
为了方便起见,文件标识常被称为文件名
C.文件的打开和关闭
1.文件指针
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的,该结构体类型是有系统声明的,取名FILE.
例如,VS2013编译环境提供的stdio.h头文件中有一下的文件类型声明:
struct _iobuf
{
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct_iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便
下面我们可以创建一个FILE*的指针变量
定义pf是一个指向FILE类型数据的指针变量,可以使pf指向某个文件的信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量就能够找到与它相关的文件
2.文件的打开和关闭
文件在读写之前应该先打开文件,在使用结束后应该关闭文件。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系
ANSIC规定使用fopen函数来打开文件,fclose来关闭文件
Open a file.
FILE *fopen( const char *filename, const char *mode );
Function | Required Header |
fopen | <stdio.h> |
读和写的基本操作:
使用默认路径打开文件(扫描当前文件夹里是否有该文件)
int main()
{
FILE* pf = fopen("test.txt","r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//...
//读文件
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
使用绝对路径打开文件(根据准确路径寻找对应文件夹)
int main()
{
FILE* pf = fopen("C:\\Users\\zpeng\\Desktop\\test.txt","r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//...
//读文件
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
Closes a stream (fclose) or closes all open streams (_fcloseall).
int fclose( FILE *stream );
Function | Required Header |
fclose | <stdio.h> |
D.文件的顺序读写
功能 | 函数名 | 适用于 |
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
Writes a character to a stream (fputc, fputwc) or to stdout (_fputchar, _fputwchar).
int fputc( int c, FILE *stream );
Function | Required Header |
fputc | <stdio.h> |
在默认位置(当前文件夹)写文件
在test.txt写入a~z
int main()
{
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//写文件
//在文件里写入a~z
char i = 0;
for (i = 'a'; i <= 'z'; i++)
{
fputc(i, pf);
}
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
Read a character from a stream (fgetc, fgetwc) or stdin (_fgetchar, _fgetwchar).
int fgetc( FILE *stream );
Function | Required Header |
fgetc | <stdio.h> |
读取test.txt内的第一个字符
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//读文件
int ch = fgetc(pf);
printf("%c\n",ch);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
使用fgetc函数的时候,如果读到EOF函数就就无法继续读的操作
可以利用fgetc这个特性读取test.txt里的所有内容
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//读文件
int ch = 0;
while ((ch = fgetc(pf)) != EOF)
{
printf("%c\n",ch);
}
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
Write a string to a stream.
int fputs( const char *string, FILE *stream );
Function | Required Header |
fputs | <stdio.h> |
写入一行数据(hello bit)
int main()
{
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//写一行数据
fputs("hello bit",pf);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
执行两次写操作的内容会放在同一行,想要换行,需要在代码内加入\n
int main()
{
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//写一行数据
fputs("hello bit\n",pf);
fputs("hello bit\n",pf);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
写文件时,会把原本文件内的内容清空,然后写入要写的内容
如果不想销毁原来的内容,就执行追加操作(在尾部追加)
int main()
{
FILE* pf = fopen("test.txt", "a");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//写一行数据
fputs("hello bit",pf);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
代码运行成功
读取成功返回要读取得字符串,读取失败返回空指针
Get a string from a stream.
char *fgets( char *string, int n, FILE *stream );
Function | Required Header |
fgets | <stdio.h> |
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
//读一行数据
char arr[20];
fgets(arr, 5, pf);
printf("%s\n",arr);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
这里读取了5个字符却显示了4个字符,为什么呢
因为还有'\0'占用了一个读取位
fprintf(写入格式化数据,也就是写入带符号,带小数点的这类数据)
Print formatted data to a stream.
int fprintf( FILE *stream, const char *format [, argument ]...);
Function | Required Header |
fprintf | <stdio.h> |
struct S
{
char arr[10];
int age;
float score;
};
int main()
{
struct S s = {"zhangsan",20,50.5};
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//写入格式化数据
fprintf(pf,"%s %d %f",s.arr,s.age,s.score);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
fscanf(读取格式化数据)
Read formatted data from a stream.
int fscanf( FILE *stream, const char *format [, argument ]... );
Function | Required Header |
fscanf | <stdio.h> |
struct S
{
char arr[10];
int age;
float score;
};
int main()
{
struct S s = {0};
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读取格式化数据
fscanf(pf,"%s %d %f",s.arr,&(s.age),&(s.score));
printf("%s %d %f\n",s.arr,s.age,s.score);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
确实从文件里读取了数据
程序员只需要关注流里数据的读写,无需关心数据是如何从内存读取,又如何写入外设的,这些内容C语言的底层逻辑已经帮我们实现了
流(一种设计思想,抽象的)
打开文件的时候会返回一个FILE*类型的指针,可以称为一个文件流
任何一个个C程序只要运行起来就会默认打开三个流
stdin,stdout,stderr这三个流的类型都是FILE*
FILE*stdin - 标准输入(键盘)
FILE*stdout - 标准输出(屏幕)
FILE*stderr - 标准错误流(屏幕)
读取文件数据到屏幕(通过输出流直接存文件读取数据到屏幕,不使用标准输出)
struct S
{
char arr[10];
int age;
float score;
};
int main()
{
struct S s = {0};
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读取格式化数据
fscanf(pf,"%s %d %f",s.arr,&(s.age),&(s.score));
//printf("%s %d %f\n",s.arr,s.age,s.score);
fprintf(stdout,"%s %d %f\n",s.arr,s.age,s.score);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
可以从键盘上读取数据,也可以从文件读取数据
以上函数适用于所有输入输出流
Reads data from a stream.
size_t fread( void *buffer, size_t size, size_t count, FILE *stream );
Function | Required Header |
fread | <stdio.h> |
fwrite(二进制输出(写),只适用于文件操作)
Writes data to a stream.
size_t fwrite( const void *buffer, size_t size, size_t count, FILE *stream );
Function | Required Header |
fwrite | <stdio.h> |
对比一组函数
scanf/fscanf/sscanf
printf/fprintf/sprintf
scanf 是针对标准输入的格式化输入语句
printf 是针对标准输出的格式化输出语句
fscanf 是针对所有输入流的格式化输入语句
fprintf 是针对所有输出流的格式化输出语句
sscanf
从一个字符串中转化出一个格式化的数据
Read formatted data from a string.
int sscanf( const char *buffer, const char *format [, argument ] ... );
Routine | Required Header |
sscanf | <stdio.h> |
struct S
{
char arr[10];
int age;
float score;
};
int main()
{
struct S s = { 0 };
char buf[100] = {"zhangsan 20 55.500000"};
//从字符串buf中获取一个格式化的数据到s中
sscanf(buf,"%s %d %f",s.arr,&(s.age),&(s.score));
printf("%s %d %f",s.arr,s.age,s.score);
return 0;
}
sprintf
把一个格式化的数据写到字符串中,本质是把一个格式化的数据转换成字符串
Write formatted data to a string.
int sprintf( char *buffer, const char *format [, argument] ... );
Routine | Required Header |
sprintf | <stdio.h> |
struct S
{
char arr[10];
int age;
float score;
};
int main()
{
struct S s = { "zhangsan", 20, 55.5f };
char buf[100] = { 0 };
sprintf(buf,"%s %d %f", s.arr,s.age,s.score);
//这里已经变成字符串了"zhangsan 20 55.5f"
printf("%s\n",buf);
return 0;
}
保存通讯录的信息到文件
void SaveContact(const contact* pc);
{
assert(pc);
FILE* pfWrite = fopen("contact.txt","wb");
if(pfWrite == NULL)
{
perror("SavaContact");
return 1;
}
//写文件 - 二进制的形式
int i = 0;
for(i = 0; i<pc->count; i++)
{
fwrite(pc->data+i,sizeof(PeoInfo),1,pfWrite);
}
fclose(pfWrite);
pfWrite = NULL;
return 0;
}
加载文件的信息到通讯录
void LoadContact(Contact* pc)
{
FILE* pfRead = fopen("contact.txt","rb");
if(pfRead == NULL)
{
perror("LoadContact");
return 1;
}
PeoInfo tmp = { 0 };
while(fread(&tmp, sizeof(PeoInfo),1,pfRead) == 1)
{
CheckCapacity(pc);
//增容函数
pc -> data[pc->count] = tmp;
pc->count++;
}
fclose(pfRead);
pfRead = NULL;
return 0;
}
E.文件的随机读写
1.fseek(定位)
根据文件指针的位置和偏移量来定位文件指针
Moves the file pointer to a specified location.
int fseek( FILE *stream, long offset, int origin );
Function | Required Header |
fseek | <stdio.h> |
fseek有三种取值,分别是
Constant | Reference position |
SEEK_SET | Beginning of file |
SEEK_CUR | Current position of the file pointer |
SEEK_END | End of file |
文件图:
int main()
{
FILE* pf = fopen("test.txt","r");
if (pf == NULL)
{
printf("%s\n",strerror(errno));
return 1;
}
//读文件
int ch = fgetc(pf);
printf("%c\n",ch);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
如果光使用fgetc,只会读到字符串的首地址,即a,再读一次会读到b,以此类推
这种方式只能一个一个读取数据,不灵活
假如要首次就读c然后直接读取f,就要使用fseek
int main()
{
FILE* pf = fopen("test.txt","r");
if (pf == NULL)
{
printf("%s\n",strerror(errno));
return 1;
}
//读文件
//定位文件指针
fseek(pf,2,SEEK_SET);//从起始位置偏移2位到目标位置
int ch = fgetc(pf);//读取到c
printf("%c\n",ch);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
int main()
{
FILE* pf = fopen("test.txt","r");
if (pf == NULL)
{
printf("%s\n",strerror(errno));
return 1;
}
//读文件
//定位文件指针
fseek(pf,2,SEEK_SET);//从起始位置偏移2位到目标位置
int ch = fgetc(pf);//读取到c
printf("%c\n",ch);
fseek(pf,2,SEEK_CUR);//从当前位置(c的后一位)偏移2位到目标位置
ch = fgetc(pf);//读取到f
printf("%c\n",ch);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
从SEEK_END的位置开始偏移,从最后一位偏移-1位就是向前偏移一位
int main()
{
FILE* pf = fopen("test.txt","r");
if(pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
//定位文件指针
fseek(pf,-1,SEEK_END);
ch = fgetc(pf);
printf("%c\n",ch);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
2.ftell(偏移量)
返回文件指针相对于起始位置的偏移量
Gets the current position of a file pointer.
long ftell( FILE *stream );
Function | Required Header | Optional Headers |
ftell | <stdio.h> | <errno.h> |
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
//定位文件指针
fseek(pf, -1, SEEK_END);
int ch = fgetc(pf);
printf("%c\n", ch);
//计算文件偏移量
printf("%d\n",ftell(pf));
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
3.rewind(回到起始位置)
让文件指针的位置回到文件的起始位置
Repositions the file pointer to the beginning of a file.
void rewind( FILE *stream );
Routine | Required Header |
rewind | <stdio.h> |
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
//定位文件指针
fseek(pf, -1, SEEK_END);
int ch = fgetc(pf);
printf("%c\n", ch);
//计算文件偏移量
printf("%d\n",ftell(pf));
//让文件回到起始位置
rewind(pf);
ch = fgetc(pf);
printf("%c\n",ch);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
F.文本文件和二进制文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件
数据在内存中以二进制的形式存储,如果不加转换的输出到外村,就是二进制文件
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换,以ASSCII字符的形式存储的文件就是文本文件
一个数据在内存中是怎样存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中只占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上之占4个字节(VS2013测试)。
G.文件读取结束的判定
1.被错误使用的feof
牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束
而是应用于当文件读取结束的时候,用来识别文件读取结束的原因,判断是以文件读取失败结束,还是遇到文件尾结束
1.文本文件读取是否结束,判断返回值是否为EOF(fgetc),或者NULL(fgets)
例如:
fgetc判断是否为EOF,feof为真就是读到了文件末尾,ferror为真就是读到了文件错误
fgets判断返回值是否为NULL
2.二进制文件的读取结束判断,判断返回值是否小于实际要读的个数
例如:
fread判断返回值是否小于实际要读的个数
H.文件缓冲区
ANSIC标准采用“缓冲文件系统”处理的数据文件,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓存区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等),缓冲区的大小根据C编译系统决定的。
先把输出缓冲区放满,输出缓冲区才会将数据传入硬件
同样的硬件要先把数据装满输入缓冲区,输入缓冲区才会将数据传入程序数据区
为了验证文件缓冲区的存在,有以下代码:
int main()
{
FILE* pf = fopen("test.txt","w");
fputs("abcdef",pf);//现将代码放在输出缓冲区
printf("睡眠10秒,已经写数据了,打开test.txt文件,发现文件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
//注:fflush在高版本的vs上不能使用了
printf("在睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
Sleep(10000);
fclose(pf);
//注:fclose在关闭文件的时候,也会刷新缓冲区
pf = NULL;
return 0;
}
数据放入缓冲区时,文件内容为空
10秒后,缓冲区的数据被写入文件(磁盘)
结论:因为有缓冲区的存在,C语言在操作文件的时候需要做刷新缓冲区或者在文件操作结束的时候关闭文件
如果不做,可能导致读写文件的问题
以上就是文件操作的全部内容,希望对你有帮助
这里是cool fire,人海茫茫,下次再见