C语言文件操作

本文介绍了程序设计中的文件概念,包括程序文件和数据文件,重点讲述了数据文件。详细解析了文件名的组成,如绝对路径和相对路径,并探讨了文件的打开与关闭,特别是fopen和fclose函数的使用。此外,还讨论了文件的读写方式,如顺序读写和随机读写,以及文件指针的定位函数fseek和文件大小获取函数ftell。最后提到了文本文件和二进制文件的区别,以及文件读取结束的判定方法。
摘要由CSDN通过智能技术生成

一、什么是文件

磁盘上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。
  程序文件:
包括源程序文件(后缀为 .c , 目标文件( windows 环境后缀为 .obj , 可执行程序( windows 环境
后缀为 .exe )。
数据文件:
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,
或者输出内容的文件。
本章讨论的是数据文件。
文件名:
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含 3 部分:文件路径 + 文件名主干 + 文件后缀
例如: c:\code\test.txt
为了方便起见,文件标识常被称为 文件名
文件名也分相对路径与绝对路径。
绝对路径:目标文件在硬盘上的真实路径(最精确路径)
例:

 这里用Everything 搜索一个应用(Windows自己的搜索太慢了),我我们可以看到这些文件后面都有路径,如:C:\Users\ASUS\AppData\Roaming,像这样的路径就是绝对路径。

相对路径:相对于当前文件位置的路径

例:

由于代码是在test_7_16文件夹里的test_7_16.c文件里,所以当前文件位置为test_7_16

int main()
{
	FILE* pf = fopen(".\\x64\\Debug\\test.txt", "w");	 
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}
	return 0;
}

fopen中的   .\\x64\\Debug\\test.txt  :

.  :表示在当前文件下。

\\ :防止编译器将"\"识别为转义字符。

这样的路径表示,在当前位置(test_7_16)的x64文件中的Debug文件下打开(创建)test.txt文件。

 在同样的条件下,运行以下代码:

int main()
{
	FILE* pf = fopen("..\\x64\\Debug\\test.txt", "w");	 
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}
	return 0;
}

..:表示上一级目录。

所以..\\x64\\Debug\\test.txt 表示在当前文件位置(test_7_16)的上一级位置(Test_7_16)的x64文件下的Debug文件中打开(创建)test.txt文件。

文件的打开和关闭
文件指针
缓冲文件系统中,关键的概念是 文件类型指针 ,简称 文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名
字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统
声明的,取名 FILE .
struct _iobuf {
        char * _ptr ;
        int   _cnt ;
        char * _base ;
        int   _flag ;
        int   _file ;
        int   _charbuf ;
        int   _bufsiz ;
        char * _tmpfname ;
      };
typedef struct _iobuf FILE ;
不同的 C 编译器的 FILE 类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个 FILE 结构的变量,并填充其中的信息,
使用者不必关心细节。
一般都是通过一个 FILE 的指针来维护这个 FILE 结构的变量,这样使用起来更加方便。
下面我们可以创建一个 FILE* 的指针变量 :
定义 pf 是一个指向 FILE 类型数据的指针变量。可以使 pf 指向某个文件的文件信息区(是一个结构体变
量)。通过该文件信息区中的信息就能够访问该文件。也就是说, 通过文件指针变量能够找到与它关联 的文件

文件的打开和关闭
文件在读写之前应该先 打开文件 ,在使用结束之后应该 关闭文件
在编写程序的时候,在打开文件的同时,都会返回一个 FILE* 的指针变量指向该文件,也相当于建立了指 针和文件的关系。
ANSIC 规定使用 fopen 函数来打开文件, fclose 来关闭文件
// 打开文件
FILE * fopen ( const char * filename , const char * mode );
// 关闭文件
int fclose ( FILE * stream );
打开方式如下:

件使用方式

指定文件不存在

r  (只读)

为了输数据,打开一个已经存在的文本文件

出错

w  (只写)

为了出数据,打开一个文本文件

一个新的文件

a  (追加)

本文件尾添加数据

一个新的文件

rb”  (只读)

为了入数据,打开一个二进制文件

出错

wb”  (只写)

为了出数据,打开一个二进制文件

一个新的文件

ab”  (追加)

向一个进制文件尾添加数据

一个新的文件

“r+”  (读写)

为了读和写,打开一个文本文件

出错

w+”  (读写)

为了读和写,建议一个新的文件

一个新的文件

a+”  (读写)

打开一个文件,在文件尾进行读

一个新的文件

“rb+”  (读写)

为了读和写打开一个二进制文件

出错

wb+”  (读写)

为了和写,新建一个新的二进制文件

一个新的文件

ab+”  (读写)

打开一个二进制文件,在文件尾进行读和

一个新的文件

文件的顺序读写
顺序读写函数介绍:

数名

用于

符输入函数

fgetc

有输入流

符输出函数

fputc

有输出流

本行输入函数

fgets

有输入流

本行输出函数

fputs

有输出流

式化输入函数

fscanf

有输入流

式化输出函数

fprintf

有输出流

二进制输

fread

文件

二进制输

fwrite

文件

对比一组函数:
scanf/fscanf/sscanf
printf/fprintf/sprintf
scanf: int scanf ( const char * format, ... ); 从标准输入中读取格式化数据。                    
fscanf: int fscanf ( FILE * stream, const char * format, ... );从流中读取格式化数据。
sscanf: int sscanf ( const char * s, const char * format, ...);从字符串中读取格式化数据
printf: int printf ( const char * format, ... );将格式化数据打印到标准输出
fprintf: int fprintf ( FILE * stream, const char * format, ... );将格式化数据写入流
sprintf: int sprintf ( char * str, const char * format, ... );将格式化数据写入字符串
struct A
{
	char arr[20];
	int a;
	double s;
};
int main()
{
	char arr1[30] = { 0 };
	struct A example = { "hello",10,3.14 };
	struct A temp = { 0 };
	sprintf(arr1, "%s %d %lf", example.arr, example.a, example.s);
	printf("arr1: %s\n", arr1);

	sscanf(arr1, "%s %d %lf", &(temp.arr), &(temp.a), &(temp.s));

	printf("temp: %s %d %lf\n", temp.arr, temp.a, temp.s);

	return 0;
}

结果:

文件的随机读写:
fseek: 根据文件指针的位置和偏移量来定位文件指针
int fseek ( FILE * stream, long int offset, int origin );

参数:
stream:指向标识流的 FILE 对象的指针。                                                                  offset:要偏移的字节数。
origin:用作偏移参考的位置,有专门的参数(如下);
参数位置
SEEK_SET文件起始位置
SEEK_CUR文件指针的当前位置
SEEK_END文件结尾位置

返回值:

如果成功,该函数将返回零。
否则,它将返回非零值。
如果发生读取或写入错误,可以用ferror函数来指示错误。

例:

int main()
{
	FILE* pf = fopen("test.txt", "w");	   //创建文件
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	fputs("abcdef", pf);	 //在文件中写入"abcdef"

	fclose(pf);
	pf = NULL;

    pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	fseek(pf, 3, SEEK_SET);		//从开始位置,向后平移3个字符

	char ch = fgetc(pf);
	printf("%c\n", ch);

	fseek(pf, -1, SEEK_CUR);	 //从现在位置,向前平移一个字符

	ch = fgetc(pf);
	printf("%c\n", ch);

	fseek(pf, -1, SEEK_END);   //从文件结尾,向前平移一个字符
	ch = fgetc(pf);
	printf("%c\n", ch);

	fclose(pf);
	pf = NULL;
	return 0;
}

允许结果为: 

" fseek(pf, 3, SEEK_SET); ".  这一步让文件指针从文件开头,向后平移3个字符,也就是从“a”开始,平移到“d”,因此,fgetc读到“d”。  

fseek(pf, -1, SEEK_CUR); ,这一步是让文件指针从现在的位置开始,向后平移一个字符,可是fgetc读到是“d”,这是由于文件指针每次读到数据,会自动向后平移一步;因此,这时的文件指针其实已经指向“e”了,向后平移一个字符后指向“d”。

fseek(pf, -1, SEEK_END):这里是让文件指向文件结尾(指最后一个字符后面,而不是最后一个字符),然后向前平移一个字符,指向“f”。

ftell: 返回文件指针相对于起始位置的偏移量
          long int ftell ( FILE * stream );
参数:

        FILE:指向标识流的 FILE 对象的指针。

返回值:

成功后,该函数返回位置标识符的当前值。失败时,返回 -1L,并将 errno 设置为特定于系统的正值。

例:

int main()
{
	FILE* pf = fopen("test.txt", "w");	   //创建文件
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	fputs("abcdef", pf);	 //在文件中写入"abcdef"

	fclose(pf);
	pf = NULL;

	pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	fseek(pf, 0, SEEK_END);	//设置文件指针指向文件结尾
	int len = ftell(pf);
	printf("%d\n", len);

	fclose(pf);
	pf = NULL;
	return 0;
}

利用fseek(pf, 0, SEEK_END);  ,让文件指针指向结尾,ftell返回位置标识符的当前值,这样可以得出总大小。

那么,问题来了,文件指针的位置标识是怎样的?也就是说文件起始位置对应标识"1"还是"0"?

用下面的代码进行验证:

int main()
{
	FILE* pf = fopen("test.txt", "w");	   //创建文件
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	fputs("abcdef", pf);	 //在文件中写入"abcdef"

	fclose(pf);
	pf = NULL;

	pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	int len = ftell(pf);
	printf("%d\n", len);

	char ch = fgetc(pf);
	printf("%c\n", ch);

    len = ftell(pf);
	printf("%d\n", len);

	fseek(pf, -1, SEEK_CUR);
    ch = fgetc(pf);
	printf("%c\n", ch);

	fclose(pf);
	pf = NULL;
	return 0;
}

在这几行代码中,不对pf进行任何操作,直接用ftell返回pf的位置标识,结果为0,但是,这个"0"是否对应”a“呢?还是像文件结尾那样,对应一个其他字符?于是,用fgetc读取一个字符,文件指针也向后平移一个字符,这时,再打印ch的内容和用ftell得到位置标识,分别得到"a"和"1"。再用fseek,让文件指针向后平移一步,ch内容又得到"a",所以,文件指针对应的位置标识应该和数组小标一样,从"0"开始。

rewind: 让文件指针的位置回到文件的起始位置
void rewind ( FILE * stream );

参数:stream: 指向标识流的 FILE 对象的指针。

例:

#include <stdio.h>

int main ()
{
  int n;
  FILE * pFile;
  char buffer [27];

  pFile = fopen ("myfile.txt","w+");
  for ( n='A' ; n<='Z' ; n++)
    fputc ( n, pFile);
  rewind (pFile);
  fread (buffer,1,26,pFile);
  fclose (pFile);
  buffer[26]='\0';
  puts (buffer);
  return 0;
}

代码中,fputc进行了26次,这时想读取文件中的数据,就必须让文件指针回到文件起始位置。

  rewind (pFile);  就起到了这个作用。

 

文本文件和二进制文件:
根据数据的组织形式,数据文件被称为 文本文件 或者 二进制文件
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是 二进制文件
如果要求在外存上以 ASCII 码的形式存储,则需要在存储前转换。以 ASCII 字符的形式存储的文件就是 本文件
一个数据在内存中是怎么存储的呢?
字符一律以 ASCII 形式存储,数值型数据既可以用 ASCII 形式存储,也可以使用二进制形式存储。
如有整数 10000 ,如果以 ASCII 码的形式输出到磁盘,则磁盘中占用 5 个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4 个字节。
例:
int main()
{
	FILE* pf = fopen("test.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	int n = 10000;
	fprintf(pf, "%d", n);

	fclose(pf);
	pf = NULL;
	return 0;
}

这样用fprintf写入文件,10000这个数值将以ASCLL码的形式输入到硬盘,占5个字节。

int main()
{
	FILE* pf = fopen("test.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	int n = 10000;
	fwrite(&n, sizeof(int), 1, pf);

	fclose(pf);
	pf = NULL;
	return 0;
}

  而二进制形式输出,则在磁盘上只占4个字节。

int main()
{
	FILE* pf = fopen("test.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 0;
	}

	int n = 10000;
	fwrite(&n, sizeof(int), 1, pf);

	fclose(pf);
	pf = NULL;
	return 0;
}

文件读取结束的判定:
 被错误使用的feof
牢记:在文件读取过程中,不能用feof函数的返回值直接来判断文件的是否结束。
feof 的作用是:当文件读取结束的时候,判断是读取结束的原因是否是:遇到文件尾结束。
1. 文本文件读取是否结束,判断返回值是否为 EOF fgetc ),或者 NULL fgets
例如:
fgetc 判断是否为 EOF .
fgets 判断返回值是否为 NULL .
2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread 判断返回值是否小于实际要读的个数。

例:
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
    int c; // 注意:int,非char,要求处理EOF
    FILE* fp = fopen("test.txt", "r");
    if(!fp) {
        perror("File opening failed");
        return EXIT_FAILURE;
   }
 //fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
    while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
   { 
       putchar(c);
   }

 //判断是什么原因结束的
    if (ferror(fp))
        puts("I/O error when reading");
    else if (feof(fp))
        puts("End of file reached successfully");
    fclose(fp);
}

文件缓冲区:

ANSIC 标准采用 缓冲文件系统 处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中 为程序 中每一个正在使用的文件开辟一块“ 文件缓冲区 。从内存向磁盘输出数据会先送到内存中的缓冲区,装 满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓 冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区小根 据C 编译系统决定的。

 

才疏学浅,纰漏百出,如有问题,欢迎指出

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值