常用文件操作函数


前言

什么是文件

在程序设计中,我们一般谈的文件有两种:程序文件、数据文件。

程序文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀
为.exe)。
数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

这里我们讨论的是数据文件。我们以前所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上的文件。

为什么要使用文件

是为了“持久化”。持久化就是让数据一直持续地存储下去。写入磁盘/文件中就是一个最简单常用的解决方案。

文件名

一个文件要有一个唯一的文件标识,以便用户识别和引用。为了方便起见,文件标识常被称为文件名

文件名包含3部分:文件路径+文件名主干+文件后缀(扩展名)。例如:c:\code\test.txt

扩展名的用处:
1.区分文件的种类。
2.告诉操作系统使用哪个程序来默认打开这个文件。

更准确地说,在系统上,是通过文件的“路径”作为文件的身份标识。

路径又分为绝对路径相对路径

例如D:\program2\qq\Bin\QQ(2).exe 就是绝对路径。
若以D:\program2\qq\Bin 作为参考,此时.\QQ(2).exe 就是一个相对路径。因此,相对路径需要给出一个“参考系”,告诉我们要从那个目录出发来找这个文件。

当我们需要使用代码来操作文件的时候,就需要通过文件的路径来指定库函数要操作哪个文件。此处指定相对路径或绝对路径都是可以的。

注意:更推荐使用/而不是反斜杠\,避免转义带来的麻烦。

文件类型

根据数据的组织形式,数据文件被称为文本文件或者二进制文件

数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件

如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件

PS:记事本是按照文本文件的方式来打开的。jpg、docx、xlsx等都是以二进制的方式打开的。


一、文件的打开与关闭

文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
在程序中,若文件使用完毕,一定要关闭文件,否则会导致文件资源泄露/句柄泄露。

在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件
的关系。

ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。

	FILE * fopen ( const char * filename, const char * mode );
	int fclose ( FILE * stream );

mode参数如下:

mode
含义
若指定文件不存在
“r”(只读)为了输入数据,打开一个已经存在的文本文件出错
“w”(只写)为了输出数据,打开一个文本文件建立一个新的文件
“a”(追加)向文本文件尾添加数据出错
“rb”(只读)为了输入数据,打开一个二进制文件出错
“wb”(只写)为了输出数据,打开一个二进制文件建立一个新的文件
“ab”(追加)向一个二进制文件尾添加数据出错
“r+”(读写)为了读和写,打开一个文本文件出错
“w+”(读写)为了读和写,新建一个新的文件建立一个新的文件
“a+”(读写)打开一个文件,在文件尾进行读写建立一个新的文件
“rb+”(读写)为了读和写打开一个二进制文件出错
“wb+”(读写)为了读和写,新建一个新的二进制文件建立一个新的文件
“ab+”(读写)打开一个二进制文件,在文件尾进行读和写建立一个新的文件

下面看一个例子:

	FILE* f = fopen("d:/test.txt", "w");
	if (f == NULL) {
		// printf("文件打开失败! errno = %d, %s\n", errno, strerror(errno));
		perror("文件打开失败!");
		system("pause");
		return 1;
	}
	printf("文件打开成功!\n");

C的标准库和一些系统函数中,很多函数在执行出错的时候都会把出错的信息设置到errno这个错误码中,然后就可以通过错误码识别出错的原因。

如果程序是对的,此时的errno默认是0。如果是非0,说明上一个操作是出错的。

注意需要引入errno.h头文件。若文件打开失败,fopen返回NULL,可以打印出errno错误码,并且使用strerror(errno)输出错误码对应的解释。为了简化写法,可以直接而使用perror()函数代替,两者是等价的。

这种基于错误码的报错方式,是上世纪的开发方式,现在开发时,会直接抛出异常(Go语言除外)。

如果反复使用fopen打开文件,而没有使用fclose关闭,最终会达到打开文件的数量上限。这个数量是可以配置的。

PS:一个程序在启动的时候,自己默认打开了3个文件——标准输入stdin、标准输出stdout、标准错误stderr

二、文件的顺序读写

功能
函数名
适用于
字符输入函数fgetc所有输入流
字符输出函数fputc所有输出流
文本行输入函数fgets所有输入流
文本行输出函数fputs所有输出流
格式化输入函数fscanf所有输入流
格式化输出函数fprintf所有输出流
二进制输入fread文件
二进制输出fwrite文件

fread

fread 负责把磁盘上的数据读取到内存中.

	FILE* f = fopen("d:/test.txt", "w");
	if (f == NULL) {
		// printf("文件打开失败! errno = %d, %s\n", errno, strerror(errno));
		perror("文件打开失败!");
		system("pause");
		return 1;
	}
	printf("文件打开成功!\n");
	
	char buf[1024] = { 0 };
	// fread 负责把磁盘上的数据读取到内存中. 
	// 其中第二个参数和第三个参数相乘, 就得到了要读取的整体的字节数. 
	// 返回值表示实际读取到的元素个数. 
	// 如果实际读到的元素个数小于预期的要读的元素个数, 就可以认为
	// 文件读完了
	int n = fread(buf, 1, 1024, f);
	printf("%s\n", buf);

fwrite

fwrite 负责把磁盘上的数据读取到内存中。

	char buf[1024] = "hahaha";
	// fwrite 负责把内存的数据写到磁盘中
	// 如果 fwrite 写成功了, 那么就会返回实际写入的元素个数. 
	// 如果失败了就会返回 < 0 的结果.
	int n = fwrite(buf, 1, strlen(buf), f);
	if (n < strlen(buf)) {
		perror("fwrite");
	}

fprintf和fscanf

	// 使用 fprintf 进行格式化写入
	int num = 10;
	fprintf(f, "num = %d", num);
	
	// 这个操作与 printf 等价. 
	fprintf(stdout, "num = %d", num);

	//这个操作与 scanf 等价.
	fscanf(stdin, ""); 
	

sprintf和sscanf

这两个函数不直接和文件操作有关,但是非常重要的函数。
sprintf 把格式化的结果写到字符串中。
sscanf 是从格式化字符串中解析结果。

	// sprintf / sscanf 是非常重要的函数
	char buf[1024] = { 0 };
	sprintf(buf, "num = %d", num);
	printf("%s\n", buf);

sprintf 和 sscanf 的一个典型用法:
把整数转成字符串,把字符串转成整数。

	int num = 10;
	// buf 中的内容是一个 "10"
	char buf[1024] = { 0 };
	// 这个操作不是 "输出", 而是把 int 这个数据, 给放到 char buf[] 数组里了
	sprintf(buf, "%d", num);

	printf("%c\n", buf[0]);
	printf("%c\n", buf[1]);
	printf("%c\n", buf[2]);

	printf("%s\n", buf);

在 C 语言中,还有一组函数也能实现字符串和整数的转换:
atoi 把字符串,转成整数。
itoa 把整数,转成字符串。

三、文件的随机读写

fseek

fseek可以理解成修改光标(Cursor)的位置。

	int fseek ( FILE * stream, long int offset, int origin );

作一个比喻:文件指针FILE*就像一个水管,读写操作均需要通过这根水管来进行,而水池就相当于文件。那么fseek函数可以修改cursor来移动文件指针的位置,来对不同的文件进行操作。
在这里插入图片描述

例子:

/* fseek example */
#include <stdio.h>
int main ()
{
	 FILE * pFile;
	 pFile = fopen ( "example.txt" , "wb" );
	 fputs ( "This is an apple." , pFile );
	 fseek ( pFile , 9 , SEEK_SET );
	 fputs ( " sam" , pFile );
	 fclose ( pFile );
	 return 0;
}

四、文件结束判定

判断文件读取完毕的标志因函数而异。

二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。

如fread,第三个参数表示预期要读的元素个数count,返回值表示实际读到的元素个数n。那么若n < count 就认为读完了;若没有读完,一定是 n == count的。

文本文件读取是否结束,判断返回值是否为EOF或者NULL。

fgetc返回EOF(即-1)。
fgets返回NULL表示读取完毕了。

牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束
而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值