文件操作
0.前言
本篇我们学习的是文件相关的操作,例如文件的打开、读取等等,还有流的概念。
1.为什么使用文件?
我们之前写的代码的数据是存放在内存里面的,当程序结束的时候,数据就不存在了,如果你想获取上次的数据,那么这种方式是做不到的。
所以我们要将数据持久化,我们一般数据持久化的方法有,把数据存放在磁盘文件、存放到数据库等方式。使用文件,可以直接将数据存放到电脑的磁盘上,做到数据的持久化。
2.什么是文件?
磁盘文件就是文件。
当谈到文件一般有两种(按功能来分),程序文件和数据文件。
2.1程序文件
包括源程序文件(后缀为.c),
目标文件(windows环境后缀为.obj),
可执行程序(windows环境后缀为.exe)等等
2.2数据文件
文件的内容不一定是程序,也可以是程序运行时读写的数据,向文件中写入数据,或者从数据文件中读取数据,这类文件被称为数据文件。
本章主要讨论数据文件,以前对数据的输入输出都是以终端为对象,就是键盘输入,输出在屏幕上。现在我们要从磁盘上输入数据或者向磁盘上输出数据。
2.3文件名
一个文件有一个唯一的标识就是文件名
文件名包含3部分:文件路径+文件名主干+文件后缀
例如文件名如下:
c:\code\test.txt
c:\code是文件路径
test是文件主干名
.txt是文件后缀
3.文件的打开和关闭
3.1文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名FILE。
在不同的编译器上该结构体的可能会略有不同,但是大同小异,使用方法是一样的。
接下来我们声明一个文件指针,该指针指向一个相应的文件信息区,通过该指针就能访问文件的信息。
FILE* pf;//文件指针变量
3.2文件打开和关闭函数
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。
//打开文件
FILE * fopen ( const char * filename, const char * mode );
//关闭文件
int fclose ( FILE * stream );
(1)fopen函数打开成功返回一个函数指针,打开失败返回NULL。
(2)filename 是要打开的文件的文件名
(3)mode 打开方式(接下来会有一张表)
(4)stream是指向要关闭文件的指针
那如何使用呢?
#include <stdio.h>
int main ()
{
FILE * pFile;
//打开文件(只写的方式)
pFile = fopen ("myfile.txt","w");
//文件操作
if (pFile!=NULL)
{
fputs ("fopen example",pFile);
//关闭文件
fclose (pFile);
}
return 0;
}
4.文件顺序读写
打开文件后,要对文件进行读(输入)写(输出)操作。
4.1相关函数介绍
流的概念
C语言的I/O系统为用户提供了一个接口,该接口与实际的存取设备无关。只是设备的一个抽象表示形式。这个抽象的接口称为流,实际的设备称为文件。C文件系统可以与各种设备一起使用,如打印机、硬盘、终端等,缓冲文件系统可以将每个设备转换成逻辑设备,即所谓的流。所有的流工作方式类似,所以很容易操作不同的设备。
一个C语言程序,打开后,默认会打开三个流(stream):
- stdin:标准输入流 --键盘
- stdout:标准输出流 --显示器
- stderr:标准错误流
4.2对比一组函数
scanf/fscanf/sscanf
printf/fprintf/sprintf
scanf是从标准输入流(stdin)中读取格式化的数据
fscanf是从任何流中读取格式化的数据
sscanf是读取字符串中格式化的数据
printf函数是将数据格式化输出到标准输出流(stdout)
fprintf函数可以将数据格式化输出到任何流中
sprintf函数是将格式化的数据转化成字符串
//sscanf和sprintf函数使用例子
int main()
{
char arr[30] = { 0 };
struct S s = { 100, 3.14f, "hehe" };
struct S tmp = {0};
//将结构体中格式化的数据转换成字符串存储到arr中
sprintf(arr, "%d %f %s", s.a, s.s, s.str);
//将arr中的字符串,格式化读取到tmp结构体中
sscanf(arr, "%d %f %s", &(tmp.a), &(tmp.s), tmp.str);
//操作完之后s和tmp结构体中的数据应该是一样的。
printf("%d %f %s\n", tmp.a, tmp.s, tmp.str);
return 0;
}
5.文件的随机读写
5.1 fseek
(1)origin是指针函数的起始位置
SEEK_SET 文件开始的位置
SEEK_CUR 文件指针当前的位置
SEEK_END 文件的末尾
(2)offset是相对于origin的偏移量,右是正数,左是负数
(3)假如该函数成功返回0,不成返回非0
/* fseek example */
#include <stdio.h>
int main ()
{
FILE * pFile;
//二进制写的方式打开文件
pFile = fopen ( "example.txt" , "wb" );
//文件的输出
fputs ( "This is an apple." , pFile );
//T相对起始位置偏移量为0
fseek ( pFile , 9 , SEEK_SET );
//文件指针指向n
fputs ( " sam" , pFile );
fclose ( pFile );
return 0;
}
5.2 ftell
(1)返回值是当前文件指针相对起始位置的偏移量
(2)stream是一个文件指针
/* ftell example : getting size of a file */
#include <stdio.h>
int main ()
{
FILE * pFile;
long size;
pFile = fopen ("myfile.txt","rb");
if (pFile==NULL) perror ("Error opening file");
else
{
//将文件指针指向末尾
fseek (pFile, 0, SEEK_END); // non-portable
size=ftell (pFile);
fclose (pFile);
printf ("Size of myfile.txt: %ld bytes.\n",size);
}
return 0;
}
5.3 rewind
(1)stream为一个文件指针
(2)该函数会将文件指针回到文件的起始位置
/* rewind example */
#include <stdio.h>
int main ()
{
int n;
FILE * pFile;
char buffer [27];
pFile = fopen ("myfile.txt","w+");
for ( n='A' ; n<='Z' ; n++)
fputc ( n, pFile);
rewind (pFile);
fread (buffer,1,26,pFile);
fclose (pFile);
buffer[26]='\0';
puts (buffer);
return 0;
}
6.文本文件和二进制文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(整型类型)。
7.文件读取结束判定
7.1被错误使用的feof
注意:在文件读取过程中,不能用feof函数的返回值直接来判断文件的是否结束
feof的作用是当文件读取结束后判断是否是遇到文件结尾结束的。
- 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如:
fgetc 判断是否为 EOF .
fgets 判断返回值是否为 NULL . - 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread判断返回值是否小于实际要读的个数。
文本文件的例子
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
int c; // 注意:int,非char,要求处理EOF
FILE* fp = fopen("test.txt", "r");
if(!fp) {
perror("File opening failed");
return EXIT_FAILURE;
}
//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
{
putchar(c);
}
//判断是什么原因结束的
if (ferror(fp))
puts("I/O error when reading");
else if (feof(fp))
puts("End of file reached successfully");
fclose(fp);
}
二进制文的例子
enum { SIZE = 5 };
int main(void)
{
double a[SIZE] = {1.,2.,3.,4.,5.};
FILE *fp = fopen("test.bin", "wb"); // 必须用二进制模式
fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组
fclose(fp);
double b[SIZE];
fp = fopen("test.bin","rb");
size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组
if(ret_code == SIZE) {
puts("Array read successfully, contents: ");
for(int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
putchar('\n');
} else { // error handling
if (feof(fp))
printf("Error reading test.bin: unexpected end of file\n");
else if (ferror(fp)) {
perror("Error reading test.bin");
}
}
fclose(fp);
}
8.文件缓冲区
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
程序数据区和输入输出缓冲区都在内存中,输入输出缓冲区和外存交互。
这里可以得出一个结论:
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。
如果不做,可能导致读写文件的问题。