【C语言】文件操作

目录

Ⅰ、为什么使用文件

Ⅱ、什么是文件

         1 .程序文件

         2 .数据文件 

         3 .文件名

Ⅲ、文件的打开和关闭

         1 .文件指针

         2 .文件的打开和关闭

Ⅳ、文件的顺序读写

          1 .对比一组函数:

Ⅴ、文件的随机读写

          1 .fseek

          2 .ftell

          3 .rewind

Ⅵ、文本文件和二进制文件

   ​编辑

Ⅶ、文件读取结束的判定

Ⅷ、文件缓冲区


Ⅰ、为什么使用文件

我们前面学习结构体时,写了通讯录的程序,当通讯录运行起来的时候,可以给通讯录中增加、删除数据,此时数据是存放在内存中,当程序退出的时候,通讯录中的数据自然就不存在了,等下次运行通讯录程序的时候,数据又得重新录入,如果使用这样的通讯录就很难受。
我们在想既然是通讯录就应该把信息记录下来,只有我们自己选择删除数据的时候,数据才不复存在。这就涉及到了数据持久化的问题,我们一般数据持久化的方法有,把数据存放在磁盘文件、存放到数据库等方式。
使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化。

Ⅱ、什么是文件

磁盘上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种: 程序文件、数据文件 (从 文件功能 的角度来分类的)。

         1 .程序文件

包括源程序文件(后缀为 .c , 目标文件( windows 环境后缀为 .obj , 可执行程序( windows 环境后缀为.exe )。

         2 .数据文件 

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
本篇讨论的是数据文件。
在以前各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。

         3 .文件名

一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含 3 部分: 文件路径+文件名主干+文件后缀
例如: c:\code\test.txt
为了方便起见, 文件标识 常被称为 文件名

Ⅲ、文件的打开和关闭

         1 .文件指针

缓冲文件系统中,关键的概念是 文件类型指针 ,简称 文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个 结构体变量 中的。该 结构体类型 是有系统声明的,取名FILE .
例如, VS2013 编译环境提供的 stdio.h 头文件中有以下的文件类型申明:
struct _iobuf {
        char * _ptr ;
        int   _cnt ;
        char * _base ;
        int   _flag ;
        int   _file ;
        int   _charbuf ;
        int   _bufsiz ;
        char * _tmpfname ;
      };
typedef struct _iobuf FILE ;
不同的 C 编译器的 FILE 类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个 FILE 结构的变量,并填充其中的信息,使用者不必关心细节。
一般都是通过一个 FILE 的指针来维护这个 FILE 结构的变量,这样使用起来更加方便。
下面我们可以创建一个 FILE* 的指针变量 :
FILE * pf ; // 文件指针变量
定义 pf 是一个指向 FILE 类型数据的指针变量。可以使 pf 指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联 的文件
比如:

         2 .文件的打开和关闭

文件在读写之前应该先 打开文件 ,在使用结束之后应该 关闭文件
在编写程序的时候,在打开文件的同时,都会返回一个 FILE* 的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC 规定使用 fopen 函数来打开文件, fclose 来关闭文件。
// 打开文件
FILE * fopen ( const char * filename , const char * mode );
// 关闭文件
int fclose ( FILE * stream );//成功返回 0,失败返回 EOF
打开方式如下:

实例代码:
/* fopen fclose example */
#include <stdio.h>
int main ()
{
          FILE * pFile ;
          // 打开文件
          pFile = fopen ( "myfile.txt" , "w" );
          // 文件操作
          if ( pFile != NULL )
        {
            fputs ( "fopen example" , pFile );
            // 关闭文件
            fclose ( pFile );
        }
  return 0 ;
}

注意:若文件中有数据,当用读方式打开的时候,会把文件清空。以写打开方式则不会。

如果用追加方式打开,则能对文件进行写入的同时不会清空原有数据。

Ⅳ、文件的顺序读写

          1 .对比一组函数:

scanf        /        fscanf        /        sscanf
printf        /        fprintf         /        sprintf

这里我们先介绍一个东西——流:

流是一个高度抽象的概念:

如图:流一般是给我们传输数据用。当我们需要传输数据到外部设备上面时,数据会被传到流里面,然后通过流传递到外部设备上。流类似为一个内部到外部的 快递站 。

为了方便,这里就定义了3个数据流——stdout stdin stderr。分别是标准输出——屏幕,标准输入——键盘,标准错误——屏幕。

printf—scanf

函数原型:

成功后,将返回写入的字符总数

如果发生写入错误,则设置错误指示符 (ferror) 并返回负数

如果写入宽字符时发生多字节字符编码错误,则 errno 设置为 EILSEQ 并返回负数。

成功后,该函数返回成功填充的参数列表的项数。此计数可能与预期的项目数匹配,也可能由于匹配失败、读取错误或文件末尾的范围而更少(甚至为零)。

如果在读取时发生读取错误或到达文件末尾,则设置正确的指示器(feof 或 ferror)。

而且,如果在成功读取任何数据之前发生任何情况,则返回 EOF。

如果在解释宽字符时发生编码错误,则该函数会将 errno 设置为 EILSEQ。

这里的printf和scanf就是标准输出输入函数,我们经常使用,这里就不过多赘述了。

fprintf—fscanf

函数原型:

返回值:

成功后,将返回写入的字符总数。

如果发生写入错误,则设置错误指示符 (ferror) 并返回负数。

如果写入宽字符时发生多字节字符编码错误,则 errno 设置为 EILSEQ 并返回负数。

成功后,该函数返回成功填充的参数列表的项数。此计数可能与预期的项目数匹配,也可能由于匹配失败、读取错误或文件末尾的范围而更少(甚至为零)。

如果在读取时发生读取错误或到达文件末尾,则设置正确的指示器(feof 或 ferror)。

而且,如果在成功读取任何数据之前发生任何情况,则返回 EOF。

如果在解释宽字符时发生编码错误,则该函数会将 errno 设置为 EILSEQ。

返回值:实际读取的数据个数,出错或者到结尾返回EOF。

这里的两个函数是用于格式化输入输出的,我们不仅可以用他们从键盘输入从终端屏幕输出:

也可以输出到文件:

从文件中格式化提取数据并打印:

sprintf—sscanf

函数原型:

 返回值:

成功后,该函数返回成功填充的参数列表中的项数。此计数可以与预期的项目数匹配,也可以在匹配失败的情况下更少(甚至为零)。
如果在成功解释任何数据之前发生输入失败,则返回 EOF。

返回值:

成功后,将返回写入的字符总数。此计数不包括自动追加在字符串末尾的其他 null 字符。
失败时,返回负数。

这两个函数是格式化字符串发送到缓冲区中(buffer)里面,从缓冲区中提取数据跟fscanf一样,只是改变提取位置就行了;

Ⅴ、文件的随机读写

          1 .fseek

根据文件指针的位置和偏移量来定位文件指针。
int fseek ( FILE * stream , long int offset , int origin );
例子:
/* fseek example */
#include <stdio.h>
int main ()
{
          FILE * pFile ;
          pFile = fopen ( "example.txt" , "wb" );
          fputs ( "This is an apple." , pFile );
          fseek ( pFile , 9 , SEEK_SET );
          fputs ( " sam" , pFile );
          fclose ( pFile );
          return 0 ;
}
执行结果:

          2 .ftell

返回文件指针相对于起始位置的偏移量
long int ftell ( FILE * stream );
例子:
/* ftell example : getting size of a file */
#include <stdio.h>
int main ()
{
          FILE * pFile ;
          long size ;
          pFile = fopen ( "myfile.txt" , "rb" );
          if ( pFile == NULL ) perror ( "Error opening file" );
          else
        {
            fseek ( pFile , 0 , SEEK_END );   // non-portable
            size = ftell ( pFile );
            fclose ( pFile );
            printf ( "Size of myfile.txt: %ld bytes.\n" , size );
        }
          return 0 ;
}
执行结果:

          3 .rewind

让文件指针的位置回到文件的起始位置
void rewind ( FILE * stream );
例子:
/* rewind example */
#include <stdio.h>
int main ()
{
          int n ;
          FILE * pFile ;
          char buffer [ 27 ];
          pFile = fopen ( "myfile.txt" , "w+" );
          for ( n = 'A' ; n <= 'Z' ; n ++ )
            fputc ( n , pFile );
          rewind ( pFile );
          fread ( buffer , 1 , 26 , pFile );
          fclose ( pFile );
          buffer [ 26 ] = '\0' ;
          puts ( buffer );
          return 0 ;
}

执行结果:

Ⅵ、文本文件和二进制文件

根据数据的组织形式,数据文件被称为 文本文件 或者 二进制文件
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是 二进制文件
如果要求在外存上以 ASCII 码的形式存储,则需要在存储前转换。以 ASCII 字符的形式存储的文件就是 本文件
一个数据在内存中是怎么存储的呢?
字符一律以 ASCII 形式存储,数值型数据既可以用 ASCII 形式存储,也可以使用二进制形式存储。
如有整数 10000 ,如果以 ASCII 码的形式输出到磁盘,则磁盘中占用 5 个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4 个字节( VS2013 测试)。

测试代码:
#include <stdio.h>
int main ()
{
        int a = 10000 ;
        FILE * pf = fopen ( "test.txt" , "wb" );
        fwrite ( & a , 4 , 1 , pf ); // 二进制的形式写到文件中
        fclose ( pf );
        pf = NULL ;
        return 0 ;
}

   

Ⅶ、文件读取结束的判定

被错误使用的 feof
牢记:在文件读取过程中,不能用 feof 函数的返回值直接用来判断文件的是否结束。
而是 应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束
1. 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如:
fgetc 判断是否为 EOF .
fgets 判断返回值是否为 NULL .
2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread 判断返回值是否小于实际要读的个数。
正确的使用:
文本文件的例子:
#include <stdio.h>
#include <stdlib.h>
int main ( void )
{
    int c ; // 注意: int ,非 char ,要求处理 EOF
    FILE * fp = fopen ( "test.txt" , "r" );
    if ( ! fp ) {
        perror ( "File opening failed" );
        return EXIT_FAILURE ;
  }
//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回 EOF
    while (( c = fgetc ( fp )) != EOF ) // 标准 C I/O 读取文件循环
  {
      putchar ( c );
  }
// 判断是什么原因结束的
    if ( ferror ( fp ))
        puts ( "I/O error when reading" );
    else if ( feof ( fp ))
        puts ( "End of file reached successfully" );
    fclose ( fp );
}

执行结果:

二进制文件的例子:
#include <stdio.h>
enum { SIZE = 5 };
int main ( void )
{
    double a [ SIZE ] = { 1. , 2. , 3. , 4. , 5. };
    FILE * fp = fopen ( "test.bin" , "wb" ); // 必须用二进制模式
    fwrite ( a , sizeof * a , SIZE , fp ); // double 的数组
    fclose ( fp );
    double b [ SIZE ];
    fp = fopen ( "test.bin" , "rb" );
    size_t ret_code = fread ( b , sizeof * b , SIZE , fp ); // double 的数组
    if ( ret_code == SIZE ) {
        puts ( "Array read successfully, contents: " );
        for ( int n = 0 ; n < SIZE ; ++ n ) printf ( "%f " , b [ n ]);
        putchar ( '\n' );
  } else { // error handling
      if ( feof ( fp ))
          printf ( "Error reading test.bin: unexpected end of file\n" );
      else if ( ferror ( fp )) {
          perror ( "Error reading test.bin" );
      }
  }
    fclose ( fp );
}

执行结果:

Ⅷ、文件缓冲区

ANSIC 标准采用 缓冲文件系统 处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“ 文件缓冲区 。从内存向磁盘输出数据会先送到内存中的缓冲区, 装满缓冲区 后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C 编译系统决定的。

#include <stdio.h>
#include <windows.h>
//VS2013 WIN10 环境测试
int main ()
{
        FILE * pf = fopen ( "test.txt" , "w" );
        fputs ( "abcdef" , pf ); // 先将代码放在输出缓冲区
        printf ( " 睡眠 10 - 已经写数据了,打开 test.txt 文件,发现文件没有内容 \n" );
        Sleep ( 10000 );
        printf ( " 刷新缓冲区 \n" );
        fflush ( pf ); // 刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
        //注: fflush 在高版本的VS上不能使用了
        printf ( " 再睡眠 10 - 此时,再次打开 test.txt 文件,文件有内容了 \n" );
        Sleep ( 10000 );
        fclose ( pf );
        //注: fclose 在关闭文件的时候,也会刷新缓冲区
        pf = NULL ;
        return 0 ;
}

执行结果:

这里可以得出一个 结论
因为有缓冲区的存在, C 语言在操作文件的时候,需要做 刷新缓冲区或者在文件操作结束 的时候关闭文件。
如果不做,可能导致读写文件的问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

何陈陈

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值