一.什么是文件
磁盘(硬盘)上的⽂件是⽂件。 但是在程序设计中,我们⼀般谈的⽂件有两种:程序⽂件、数据⽂件(从⽂件功能的⻆度来分类 的)。
程序文件:
程序⽂件包括源程序⽂件(后缀为.c),⽬标⽂件(windows环境后缀为.obj),可执⾏程序(windows 环境后缀为.exe)。
数据文件:
⽂件的内容不⼀定是程序,⽽是程序运⾏时读写的数据,⽐如程序运⾏需要从中读取数据的⽂件,或 者输出内容的⽂件。
二.为什么使用文件
如果没有⽂件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失 了,等再次运⾏程序,是看不到上次程序的数据的,如果要将数据进⾏持久化的保存,我们可以使⽤ ⽂件。
下面我们主要介绍数据文件
三.文件名
⼀个⽂件要有⼀个唯⼀的⽂件标识,以便⽤⼾识别和引⽤。 ⽂件名包含3部分:⽂件路径+⽂件名主⼲+⽂件后缀 例如: c:\code\test.txt
为了⽅便起⻅,⽂件标识常被称为⽂件名。
四.二进制文件和文本文件
二进制文件:
数据在内存中以⼆进制的形式存储。
文本文件:
以ASCII字符的形式存储的⽂件。
一个数据在内存中的存储方式:字符⼀律以ASCII形式存储,数值型数据既可以⽤ASCII形式存储,也可以使⽤⼆进制形式存储。
五.文件的打开与关闭
1.流和标准流
1.1流
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输⼊输出 操作各不相同,为了⽅便程序员对各种设备进⾏⽅便的操作,我们抽象出了流的概念,我们可以把流 想象成流淌着字符的河。 C程序针对⽂件、画⾯、键盘等的数据输⼊输出操作都是通过流操作的。 ⼀般情况下,我们要想向流⾥写数据,或者从流中读取数据,都是要打开流,然后操作。
1.2标准流
那为什么我们从键盘输⼊数据,向屏幕上输出数据,并没有打开流呢? 那是因为C语⾔程序在启动的时候,默认打开了3个流:
• stdin-标准输⼊流,在⼤多数的环境中从键盘输⼊,scanf函数就是从标准输⼊流中读取数据。
• stdout-标准输出流,⼤多数的环境中输出⾄显⽰器界⾯,printf函数就是将信息输出到标准输出 流中。
• stderr-标准错误流,⼤多数环境中输出到显⽰器界⾯。 这是默认打开了这三个流,我们使⽤scanf、printf等函数就可以直接进⾏输⼊输出操作的。stdin、stdout、stderr三个流的类型是: FILE* ,通常称为⽂件指针。 C语⾔中,就是通过 FILE* 的⽂件指针来维护流的各种操作的。
2.文件指针
缓冲⽂件系统中,关键的概念是“⽂件类型指针”,简称“⽂件指针”。 每个被使⽤的⽂件都在内存中开辟了⼀个相应的⽂件信息区,⽤来存放⽂件的相关信息(如⽂件的名 字,⽂件状态及⽂件当前的位置等)。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系 统声明的,取名FILE.
不同的C编译器的FILE类型包含的内容不完全相同,但是⼤同⼩异。 每当打开⼀个⽂件的时候,系统会根据⽂件的情况⾃动创建⼀个FILE结构的变量,并填充其中的信 息,使⽤者不必关⼼细节。 ⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使⽤起来更加⽅便。
通过⽂件指针变量能够间接找到与 它关联的⽂件。
3.文件的打开与关闭
⽂件在读写之前应该先打开⽂件,在使⽤结束之后应该关闭⽂件。 在编写程序的时候,在打开⽂件的同时,都会返回⼀个FILE*的指针变量指向该⽂件,也相当于建⽴了 指针和⽂件的关系。 ANSIC规定使⽤ fopen 函数来打开⽂件, fclose 来关闭⽂件。
//打开⽂件
FILE * fopen ( const char * filename, const char * mode );
//关闭⽂件
int fclose ( FILE * stream );
mode表示文件的打开方式
六.文件的顺序读写
1.文件的顺序读写函数
以下讲到的六个文件的顺序读写函数都是针对于所有输入流 。
1.fgetc
作用:从流中获取字符
返回值:
成功后,将返回读取的字符(提升为int值)。返回类型为int,以适应表示失败的特殊值EOF:如果位置指示器在文件末尾,则函数返回EOF并设置流的EOF指示器(feof)。如果发生其他读取错误,函数也会返回EOF,但会设置其错误指示器(ferror)。
2.fputc
作用:将字符写入流
character:要输入的字符。
FILE*stream:文件指针。
返回值:
一旦成功,所写的字符就会返回。如果发生写入错误,则返回EOF并设置错误指示器(ferror)。
3.fgets
作用:从流里面读写一个字符串
str:指向将读取的字符串复制到其中的字符数组的指针。(指向一个数组用来存放字符串)
num: 要复制到str中的最大字符数(包括终止的null字符)。
stream:流。
返回值:
成功后,函数返回str。如果在尝试读取字符时遇到文件结尾,则设置eof指示符(feof)。如果在读取任何字符之前发生这种情况,则返回的指针为空指针(str的内容保持不变)。如果发生读取错误,则会设置错误指示器(ferror),并返回一个空指针(但str指向的内容可能已更改)。
4.fputs
作用:将一个字符串写入流中。
str:字符串
steam:流
返回值:
成功后,将返回一个非负值。出现错误时,该函数返回EOF并设置错误指示器(ferror)。
5.fscanf
作用:从流中读取格式化数据
format:格式化数据
返回值:
成功时,函数返回成功填充的参数列表的项数。此计数可能与预期的项数匹配,也可能由于匹配失败、读取错误或到达文件末尾而减少(甚至为零)。如果在读取时发生读取错误或到达文件末尾,则会设置正确的指示器(feof或ferror)。并且,如果在成功读取任何数据之前发生任何一种情况,则返回EOF。如果在解释宽字符时发生编码错误,函数会将errno设置为EILSEQ。
6.fprintf
作用:将格式化数据写入流中
返回值:
成功后,将返回写入的字符总数。如果发生写入错误,则设置错误指示器(ferror)并返回负数。如果在写入宽字符时发生多字节字符编码错误,则将errno设置为EILSEQ,并返回一个负数。
将格式化数据输入文件流:
将格式化数据输入标准输出流:
下面两个文件顺序读写函数是针对文件流的
7.fread
作用:从流中读取数据块
ptr:指向大小至少为(size*count)字节的内存块的指针,该内存块已转换为空*。
size:要读取的每个元素的大小(以字节为单位)。Size_t是一个无符号整数类型。
count:要读取元素的个数。
返回值:
返回成功读取的元素总数。如果此数字与count参数不同,则表示发生读取错误,或者读取时已到达文件末尾。在这两种情况下,都设置了适当的指示器,可以分别用ferror和feof进行检查。如果size或count为零,则函数返回零,并且ptr指向的流状态和内容保持不变。size_t是一个无符号整数类型。
8.fwrite
作用:将数据块写入流
返回值:
返回成功写入的元素总数。如果此数字与计数参数不同,则写入错误会阻止函数完成。在这种情况下,将为流设置误差指示器(ferror)。如果size或count为零,则函数返回零,并且错误指示符保持不变。size_t是无符号整数类型。
2.对⽐⼀组函数:
scanf/fscanf/sscanf
printf/fprintf/sprintf
scanf---从标准输入流上读取格式化数据
fscanf---从所有输入流(指定的一个)读取格式化数据
sscanf---在字符串中读取格式化数据
printf---把数据以格式化形式打印在标准输出流上
fprintf---把数据以格式化形式打印在指定的输出流中
sprintf---把格式化数据转化为字符串
上面我们介绍了fscanf和fprintf的用法,下面我们来介绍sscanf和sprintf的用法:
1.sscanf
作用:从字符串中读取格式化数据
返回值:
成功后,函数将返回参数列表中成功填充的项数。此计数可以与预期的项目数相匹配,或者在匹配失败的情况下小于(甚至为零)。如果在成功解释任何数据之前输入失败,则返回EOF。
2.sprintf
作用:把格式化数据转换成字符串
返回值:
成功后,将返回写入的字符总数。此计数不包括自动附加在字符串末尾的额外null字符。如果失败,则返回负数
七.文件的随机读写函数
1.fseek
作用:重新定位流位置指示器(光标的位置)
返回值:
如果成功,函数将返回零。否则,它将返回非零值。如果发生读取或写入错误,则设置错误指示器(ferror)
2.ftell
作用:返回⽂件指针相对于起始位置的偏移量
返回值:
成功后,将返回位置指示器的当前值。失败时,返回-1L,errno设置为系统特定的正值。
3.rewind
作用:让⽂件指针的位置回到⽂件的起始位置
返回值:无
八.文件结束的判断
两种形式的结束:1.文件末尾;2.发生错误。
1.feof
作用:当⽂件读取结束的时候,判断是读取结束的原因是否是:遇到⽂件尾结束。
2.ferror
作用:当文件读取结束的时候,判断读取结束的原因是否是:发生错误。
3.⽂本⽂件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )。
4.⼆进制⽂件的读取结束判断,判断返回值是否⼩于实际要读的个数。
九.文件缓冲区
ANSIC标准采⽤“缓冲⽂件系统”处理的数据⽂件的,所谓缓冲⽂件系统是指系统⾃动地在内存中为 程序中每⼀个正在使⽤的⽂件开辟⼀块“⽂件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓 冲区,装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读⼊数据,则从磁盘⽂件中读取数据输 ⼊到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓 冲区的⼤⼩根据C编译系统决定的。
因为有缓冲区的存在,C语⾔在操作⽂件的时候,需要做刷新缓冲区或者在⽂件操作结束的时候关闭⽂ 件。 如果不做,可能导致读写⽂件的问题
雯雯的分享到这结束咯!留下你们的赞和关注,评论吧!谢谢啦!