一.为什么要使用文件呢?
这是因为我们要想让数据进行持久化的保存,必须使用文件,我们写的程序的数据是存储在电脑内存里面的,如果程序退出,内存一回收,数据就会丢失,下次运行程序就看不到上次的保留结果了。
二.什么是文件?
磁盘(硬盘)上的文件是文件,但在程序设计中,我们一般说文件有两种:程序文件和数据文件
1.程序文件
程序文件包括源程序文件(.c),目标文件(.obj),可执行程序(.exe)。
2.数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件
3.文件名
一个文件要有一个唯一的文件标识,以便用户识别和使用。
文件名包含三部分:文件路径+文件名主干+文件后缀
例:c:\code\test.txt
文件标识常被称为 “ 文件名 ”。
三. 二进制文件和文本文件
数据文件被称为二进制文件和文本文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存的文件里,就是二进制文件。
如果要在外存上以ASCII码值的形式存储,则要在存储之前转换,以ASCII码值的形式存储的文件就是文本文件。
四. 文件的打开和关闭
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
int main()
{
//FILE* pf = fopen("test.x", "r"); //读文件
FILE* pf = fopen("test.x", "w"); //写文件
if (pf == NULL)
{
perror("fopen");
return;
}
//写文件
...
...
//关闭文件
fclose(pf);
pf == NULL;
return 0;
}
代码如上
1.文件打开关闭的方式以及函数操作等
需要用到fopen和fclose函数以及FILE*(文件)类型的指针
fopen函数参数
FILE * fopen (const char *filename, const char *mode);
filename就是要读取或者要写入的文件名字,mode是打开文件的方式
"r"是打开已有的文件开始读取,若是没有这个文件,则读取失败,返回NULL
"w"是打开已有的文件开始写入,若是没有这个文件,则创建一个新的文件,若是存在文件,则将文件置空进行写入
然后对文件指针pf的返回值进行判断,若是错误则不继续执行程序
fclose函数参数
int fclose(FILE *stream);
只接受一个文件类型的指针,然后释放指针,最后别忘了把指针置为NULL
2.标准流
C语言程序在启动时,默认打开三个流:
stdin — 标准输入流,大多数环境从键盘中输入,scanf就是从标注输入流中读取数据
stdout — 标准输出流,大多数环境中输出至显示器界面,printf就是把信息输出到标准输出流中
stderr — 标准错误流,大多数环境输出到显示器界面
因为默认打开了这三个流,我们才能使用scanf,printf等函数直接进行输出输入操作的
这三个流的类型是FILE *(文件)类型,通常成为文件指针
3.文件信息区
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件相关的信息,这些信息是存放在一个结构体变量中的。该结构体类型由系统声明,取名FILE。
例如vs2013的文件类型声明:
struct _iobuf
{
char* _ptr;
int _cnt;
char* _base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char* _tmpfname;
};
typedef struct _iobuf FILE;
不同的c的编译器的FILE类型包含的内容不完全相同,但都大同小异
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FIL结构的变量,并填充其中的信息,使用者不必关心细节。
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来方便。
我们可以直接创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的变量,也可以使pf指向某个文件的文件信息区(结构体变量),通过该文件的文件信息区就能访问到该文件了。
也就是通过文件指针变量可以间接找到和它关联的文件
例如:
五. 顺序读写函数
1.先来看看有哪些函数吧:
fgetc就是从文件中读取字符,并以ASCII码值的形式返回,返回类型为整形
int fgetc(FILE *stream);
参数是文件指针
而fputc就是往文件中放入字符,和fgetc相反
int fputc(int c, FILE *stream);
两个参数,第一个就是要放入文件的字符,第二个是文件指针
后面的就不一一列举了,大家下来都可以查到这些函数的使用方法
2.对比一组函数
scanf / sscanf / fscanf
printf / sprintf / fprintf
scanf - 从标准输入流上读取格式化的数据
fscanf - 从指定的输入流上读取格式化的数据
sscanf -把字符串转换成格式化的数据
printf -把数据以格式化的形式打印在标准输出流上
fprintf - 把数据以格式化的形式打印在指定的输出流上
sprintf -把格式化的数据转换成字符串
六.文件的随机读写
int fseek(FILE* stream,long int offset,int origin);
其中origin为起始位置,offset为偏移量,stream为file类型的指针也就是地址。
origin又分为三种情况:
1.SEEK_SET - 文件开头的位置
2.SEEK_CUR - 文件目前的位置
3.SEEK_END - 文件末尾的位置
我们来用一下这个函数吧
假设文件目前有abcdef五个字符,我们用fseek来改变指针的位置吧
看代码:
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return;
}
int ch = fgetc(pf);
printf("%c\n", ch); //a
fseek(pf, 3, SEEK_CUR);
ch = fgetc(pf);
printf("%c\n", ch); //e
return 0;
}
我们在文件指针目前的位置,加了偏移量3,也就是在a之后,b的第三个字符,因为每次读取到一个字符,fgetc都会使指针向前走一步,所以应该打印出来e
七.文件缓冲区
最后说一个概念 - “文件缓冲区”
ANSIC标准采用缓冲文件系统处理数据文件的,会自动给程序中每一个正在使用的文件开辟一块文件缓冲区,从内存向磁盘输入数据会先送到内存的缓冲区,等装满缓冲区以后才会一起送到磁盘上,如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区,充满以后在从缓冲区逐个将数据送到程序数据区。
缓冲区的大小根据C编译系统决定。
如图: