C语言文件知识学习总结

hezhoy

已于 2024-09-21 21:30:10 修改

阅读量1.3k

点赞数 45

文章标签： c语言学习开发语言

于 2024-09-21 07:30:00 首次发布

本文链接：https://blog.csdn.net/hezhoy/article/details/142298779

版权

文件是C语言很重要的一个知识节点，我们通过了解它，更加了解我们写的代码。在C语言中，文件操作是通过一系列的标准输入输出函数完成的，这些函数定义在stdio.h头文件中。

一、文件的分类

首先，我们了解一下什么是文件—文件存在于磁盘（硬盘）上，可以对数据进行持久化的保存，根据文件的功能来分类，文件可分为程序文件和数据文件。

1.程序文件

程序文件包括源程序文件（后缀为.c），目标文件（windows环境后缀为.obj），可执行程序（windows环境后缀为.exe）。

2.数据文件

文件的内容不一定是程序，而是程序运行时读写的数据，比如程序运行需要从中读取数据的文件，或者输出内容的文件。

二、文件的命名

在C语言中，文件名是文件存在的标识，操作系统根据文件名来对其进行控制和管理。每个文件都被设定一个指定的名称，由文件主名和扩展名组成。文件名包含三个部分：文件路径+文件名主干+文件后缀。

在C语言中定义一个文件名主要有以下几种方式：使用字符串常量、使用字符数组、使用宏定义。

在C语言中，文件名的命名对项目的可维护性和可读性至关重要。遵循一致性、避免特殊字符、使用小写字母是命名文件时需要注意的几个关键点。

三、文件的类型

- 文本文件：存储的是字符的 ASCII 码。例如，存储数字“123”时，实际上是以字符“1”“2”“3”的编码形式存储，每个字符通常占用一个或多个字节，具体取决于编码方式。可以使用文本编辑器直接打开查看和编辑，内容通常是直接可读的字符。比如一个包含英文单词和句子的文本文件，可以很容易地理解其内容。
- 二进制文件：以计算机内部的二进制形式存储数据，可以存储各种类型的数据，包括但不限于整数、浮点数、字符、图像、音频等。例如，存储整数 123 时，直接以二进制形式存储其数值。一般不能通过文本编辑器直接查看其内容，因为其中的数据以二进制形式存储，通常是不可读的乱码。例如，一个图像的二进制文件，用文本编辑器打开后会看到一堆奇怪的字符和符号。

四、文件的打开和关闭

1.流

在此，我们首先要了解流的概念，程序需要输出到各种外界设备，也需要从外界设备获取数据，不同外界设设的输入输出操作各不相同，为了方便，抽象出了流的概念，流是一条字符盛满的河流。

C语言针对文件、画面、键盘等的数据输入输出操作都是通过流实现操作的。

想向流里写数据，或者读取数据，要先打开流，然后操作。那为什么我们使用printf和scanf的时候，却不用打开流呢，这是因为在C语言程序启动的时候，默认打开了三个标准流。

1.1三个标准流

stdin-标准输入流，在大多数的环境中从键盘中输入，scanf函数就是从标准输出流中读取数据。

stdout-标准输出流，大多数的环境中输出至显示器界面printf函数将信息输出到标准输出流中。

stderr-标准错误流，大多数环境中输出到显示器界面。

这三个流的类型是：FILE*,通常被称为文件指针。

C语言中就是通过FILE*的文件指针来维护流的各种操作的。

1.2文件指针

缓存文件系统中，关键的概念是“文件类型指针”，简称“文件指针”。

每个被使用的文件都在内存中开辟了一个相应的文件信息区，用来存放文件的相关信息（如文件的名字，文件状态及文件当前的位置等）。这些信息是保存在一个结构体变量中。该结构体类型是由系统声明的，取名FILE。

2.打开文件

使用fopen()函数打开文件。该函数需要两个参数：文件名和打开模式。打开模式可以是读取模式（"r"）、写入模式（"w"）、追加模式（"a"）等。fopen()函数返回一个指向文件的指针，如果打开失败则返回NULL。

还有更多相关知识，我们来看看吧。

文件使用方式	含义	如果指定文件不存在
“r”（只读）	为了输入数据，打开一个已经存在的文件	出错
“w”（只写）	为了输入数据，打开一个文本文件	建立一个新的文件
“a“（追加）	向文本文件尾添加数据	建立一个新的文件
”rb“（只读）	为了输入数据，打开一个二进制文件	出错
”wb“（只写）	为了输入数据，打开一个二进制文件	建立一个新的文件
”ab“（追加）	向一个二进制文件尾添加数据	建立一个新的文件
”r+“（读写）	为了读和写，打开一个文本文件	出错
”w+“（读写）	为了读和写，建立一个新的文件	建立一个新的文件
”a+“（读写）	打开一个文件，在文件尾进行读写	建立一个新的文件
”rb+“（读写）	为了读和写，打开一个二进制文件	出错
”wb+“（读写）	为了读和写，建立一个新的二进制文件	建立一个新的文件
”ab+“（读写）	打开一个二进制文件，在文件未进行读和写	建立一个新的文件

3.关闭文件

使用fclose()函数关闭文件。关闭文件时，文件指针会被释放，文件占用的资源也会被释放。

下面我们用一个代码去体会一下上述知识的运用吧

//首先要创建一个名叫example.txt的文件，并输入一些内容
#include <stdio.h>

int main() {
    FILE* fp;
    char buffer[100];//创建一个空间

    fp = fopen("example.txt", "r");//以只读的方式打开
    if (fp == NULL) {
        printf("无法打开文件\n");//打开失败的提示
        return 1;
    }

    fgets(buffer, sizeof(buffer), fp);//将读取的内容给buffer中
    printf("%s", buffer);//打印读取内容

    fclose(fp);//最后，不要忘了关闭文件
    return 0;
}

五、文件的顺序读写

顺序读写函数
函数名	功能	适用于
fgetc	字符输入函数	所有输入流
fputc	字符输出函数	所有输出流
fgets	文本行输入函数	所有输入流
fputs	文本行输出函数	所有输出流
fscanf	格式化输入函数	所有输入流
fprintf	格式化输出函数	所有输出流
fread	二进制输入	文件输入流
fwrite	二进制输出	文件输出流

六、文件的随机读取

1.fseek

根据指针的位置和偏移量来定位文件指针（文件内容的光标）。

int fseek ( FILE * stream, long int offset, int origin );

例：

#include <stdio.h>

int main() {
    FILE* fp;
    char buffer[100];

    // 以只读模式打开文件
    fp = fopen("test.txt", "r");
    if (fp == NULL) {
        perror("Error opening file");
        return -1;
    }

    // 读取文件的前几个字符
    fgets(buffer, sizeof(buffer), fp);
    printf("First read: %s\n", buffer);

    // 将文件指针移动到文件开头后偏移 25 个字节的位置
    fseek(fp, 25, SEEK_SET);

    // 再次读取文件内容
    fgets(buffer, sizeof(buffer), fp);
    printf("Second read after seeking: %s\n", buffer);

    fclose(fp);
    return 0;
}

下面就是运行效果啦

2.ftell

返回文件指针相对于起始文件的偏移量

long int ftell ( FILE * stream );

例：

#include <stdio.h>

int main() {
    FILE* fp;
    char buffer[100];
    long position;

    // 以只读模式打开文件
    fp = fopen("test.txt", "r");
    if (fp == NULL) {
        perror("Error opening file");
        return -1;
    }

    // 读取文件内容
    fgets(buffer, sizeof(buffer), fp);
    printf("Read: %s\n", buffer);

    // 获取文件指针当前位置
    position = ftell(fp);
    printf("Current position in the file: %ld\n", position);

    fclose(fp);
    return 0;
}

下面就是运行效果啦

3.rewind

让文件指针的位置回到文件的起始位置。

void rewind ( FILE * stream );

例：

#include <stdio.h>

int main() {
    FILE *fp;
    char buffer[100];

    // 以只读模式打开文件
    fp = fopen("test.txt", "r");
    if (fp == NULL) {
        perror("Error opening file");
        return -1;
    }

    // 第一次读取文件内容
    fgets(buffer, sizeof(buffer), fp);
    printf("First read: %s\n", buffer);

    // 使用 rewind 将文件指针重置到文件开头
    rewind(fp);

    // 再次读取文件内容
    fgets(buffer, sizeof(buffer), fp);
    printf("Second read after rewind: %s\n", buffer);

    fclose(fp);
    return 0;
}

七、文本文件和二进制文件读取结束的判断

1.文本文件

 
#include <stdio.h>

int main() {
    FILE *textFile;
    char ch;

    textFile = fopen("text.txt", "r");
    if (textFile == NULL) {
        perror("Error opening text file");
        return -1;
    }

    while ((ch = fgetc(textFile))!= EOF) {
        // 处理读取到的字符
    }

    if (feof(textFile)) {
        printf("Reached end of text file.\n");
    } else {
        printf("Error occurred while reading text file.\n");
    }

    fclose(textFile);
    return 0;
}

在这个例子中，使用 fgetc 函数逐个读取文本文件中的字符，当 fgetc 返回 EOF （文件结束标志）且 feof 函数返回真时，确定文本文件读取结束。

2.二进制文件

#include <stdio.h>

int main() {
    FILE *binaryFile;
    unsigned char buffer;

    binaryFile = fopen("binary.dat", "rb");
    if (binaryFile == NULL) {
        perror("Error opening binary file");
        return -1;
    }

    size_t bytesRead;
    while ((bytesRead = fread(&buffer, 1, 1, binaryFile)) > 0) {
        // 处理读取到的字节
    }

    if (feof(binaryFile)) {
        printf("Reached end of binary file.\n");
    } else {
        printf("Error occurred while reading binary file.\n");
    }

    fclose(binaryFile);
    return 0;
}

对于二进制文件，使用 fread 函数读取固定大小的数据块（这里是每次读取一个字节）。当 fread 返回的读取字节数为 0 且 feof 函数返回真时，确定二进制文件读取结束。

3.错误地使用feof

作用：当文件读取结束的时候，判断是读取结束的原因是是否遇到文件结尾。所以我们错误的认为它能用来判断文件是否结束，但并非如此。

3.1使用 feof 判断文件结束的问题
feof 函数用于判断文件是否到达末尾，但不能直接用其返回值来判断文件是否结束，原因如下：
当使用输入函数（如 fscanf 、 fgetc 等）读取文件时，如果读取失败（例如由于文件损坏或其他错误），这些函数可能会返回一个错误码，同时也可能会设置文件结束标志 feof 。所以仅当输入函数返回错误码且 feof 为真时，才能确定是真正到达了文件末尾。如果仅根据 feof 的返回值判断，可能会在文件读取出现错误但并非达到末尾时错误的认为文件结束。

八、文件缓冲区

ANSIC标准采用”缓冲文件系统“处理的数据文件，所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块”文件缓冲区“。从内存向磁盘输出输出数据会先送到内存中的缓冲区，装满缓冲区才一起送到磁盘上。如果从磁盘向计算机读入数据，则会从磁盘文件中读取数据输入到内存缓冲区（充满缓冲区），然后再从缓冲区逐个的将数据送到程序数据区（程序变量等）。缓冲区的大小根据C编译系统决定的。

#include <stdio.h>

int main() {
    FILE *fp;
    fp = fopen("test.txt", "w");
    if (fp == NULL) {
        perror("Error opening file");
        return -1;
    }

    // 写入一些数据到文件，但不刷新缓冲区
    fprintf(fp, "Hello");
    fprintf(fp, " World");

    // 假设程序在这里异常退出或没有进行进一步操作

    // 如果不关闭文件或刷新缓冲区，数据可能不会完全写入到文件中

    // fclose(fp); // 关闭文件会自动刷新缓冲区并确保数据写入文件

    return 0;
}

针对以上，我们可使用setvbuf来帮助我们

int setvbuf(FILE *stream, char *buffer, int mode, size_t size);

#include <stdio.h>

int main() {
    FILE *fp;
    fp = fopen("test.txt", "w");
    if (fp == NULL) {
        perror("Error opening file");
        return -1;
    }

    // 设置行缓冲
    setvbuf(fp, NULL, _IOLBF, 0);

    fprintf(fp, "Hello");
    fprintf(fp, " World");

    fclose(fp);
    return 0;
}

由上我们可知道，c语言在操作文件的时候，需要做刷新缓冲区或者文件在操作结束的时候关系文件，如果不做，可能导致读写文件的问题。

大家一起学习，有错欢迎指出！！！