C语言K&R圣经笔记 7.5文件访问 7.6错误处理-stderr和exit

本文详细介绍了C语言中文件访问的基本操作,如使用fopen打开文件、文件指针的概念,以及如何通过stdio库实现文件复制和错误处理,重点强调了stderr和exit在错误输出和程序终止中的作用。
摘要由CSDN通过智能技术生成

7.5 文件访问

到目前为止,给出的例子都是读标准输入和写标准输出,而标准输入和输出都是由本地操作系统自动为程序定义的。

下一步是写个程序来访问还没有被连接到程序上的文件。我们以一个叫做 cat 的程序来说明这种操作需求,它连接一系列指定的文件并打印到标准输出。cat 用来在屏幕上打印文件,它还能用作通用的输入收集器,供那些没有能力通过名字来访问文件的程序所使用。例如下面的命令行

cat x.c y.c

在标准输出上打印文件 x.c 和 y.c 的内容(没有其他东西)。

问题在于如何安排这些指定要读的文件——即如何把用户想到的一个外部名字和读数据的语句关联起来。

规则是简单的。在文件能被读写之前,它必须用库函数 fopen 来“打开”。fopen 获取一个如 x.c 或 y.c 这样的外部名称,做一些杂活,并和操作系统协商(细节我们不关心),然后返回一个后续可以用来对文件进行读或写操作的指针。

这个指针,称为文件指针,指向一个包含文件信息的结构体,例如:缓存的位置,缓存中当前字符的位置,文件是被还是写,是否遇到了错误或者文件结束,等等。用户不需要知道细节,因为从<stdio.h> 中获取的定义包含了一个称为 FILE 的结构体。而使用文件指针,只需要如下声明:

FILE *fp;
FILE *fopen(char *name, char *mode);

这里说 fp 是指向 FILE 的指针,而 fopen 返回一个指向 FILE 的指针。注意 FILE 是类型名,就像int 一样,而不是结构体标签;它是用 typedef 定义的。(关于如何在 UNIX 系统上实现 fopen,详见 8.5 节)

程序里调用 fopen 的方式如下:

fp = fopen(name, open);


fopen 的第一个参数是包含文件名的字符串指针。第二个参数也是一个字符串指针,叫“模式”,表示我们想要如何使用这个文件。允许的模式包括读("r"),写("w")和追加("a")。某些系统区分文本文件和二进制文件;对于后者,必须在模式字符串后面加上一个 "b"。


如果模式为“写”或“追加”时文件不存在,则(若可能的话)会创建这个文件。以写模式打开一个已存在的文件,会使其丢弃旧的内容,而用追加模式,则会保留旧内容。试图读不存在的文件是错误的,另外还可能存在其他错误,例如试图读你无权访问的文件。如果有任何错误,fopen 会返回 NULL。(可以更精确地标识错误,参见附录 B 第一节末尾讨论的错误处理函数)

一旦文件被打开,下一件需要的事是读或写文件的方式。有几种可能的方式,其中 getc 和putc 是最简单的。getc 返回文件的下一个字符;需要文件指针来告诉它读的是哪个文件。

int getc(FILE *fp)

getc 从通过 fp 所指的流中返回下一个字符;如果文件结尾或错误,则返回 EOF。

putc 是输出函数

int putc(int c, FILE *fp)

putc 把字符 c 写到通过 fp 所指的流中,并返回所写的字符,如果遇到错误则返回 EOF。像 getchar 和 putchar 一样,getc 和 putc 也可能是宏而不是函数。

当一个 C 程序启动时,操作系统环境负责打开三个文件并提供其文件指针。这三个文件是:标准输入、标准输出和标准错误;对应的文件指针称为 stdin、stdout 和 stderr,均在 <stdio.h> 中声明。通常 stdin 连接到键盘,而 stdout 和 stderr 连接到屏幕,不过 stdin 和 stdout 可以被重定向到文件或管道,如7.1节所述。

getchar 和 putchar 可以用 getc、putc、stdin、stdout 来定义,如下:

#define getchar()     getc(stdin)
#define putchar(c)    putc((c), stdout)

对文件的格式化输入和输出,可以使用 fscanf 和 fprintf。它们与 scanf 和 printf 完全一样,仅仅区别在第一个参数是要读或写的文件指针,第二个参数才是格式化字符串。

int fscanf(FILE *fp, char *format, ...)
int fprintf(FILE *fp, char *format, ...)

有了这些预备知识之后,我们现在就能够写出用来连接文件的 cat 程序了。我们采用的是大家发现对很多程序来说都很方便的一个设计。如果有命令行参数,则将它们解释为文件名,并依次处理。如果没有,则处理标准输入。

#include <stdio.h>

/* cat:连接多个文件,第一版 */
main(int argc, char *argv[])
{
    FILE *fp;
    void filecopy(FILE *, FILE *);

    if (argc == 1)    /* 无参数,拷贝标准输入 */
        filecopy(stdin, stdout);
    else
        while (--argc > 0) {
            if ((fp = fopen(*++argv, "r") == NULL) {
                printf("cat: can't open %s\n", *argv);
                return 1;
            } else {
                filecopy(fp, stdout);
                fclose(fp);
            }
        }
    return 0;
}
/* filecopy: 把文件ifp 拷贝到文件 ofp */
void filecopy(FILE *ifp, FILE *ofp)
{
    int c;
    
    while ((c = getc(ifp)) != EOF)
        putc(c, ofp);
}

文件指针 stdin 和 stdout 是 FILE * 类型的对象。然而,它们是常量而不是变量,因此不可能对它们赋值。

函数 flose 

int fclose(FILE *fp)

是 fopen 的反面;它打断了由 fopen 建立的文件指针和外部名称的关联,并将文件指针释放给其他文件使用。由于大部分操作系统对一个程序可以同时打开的文件数量有限制,当不再需要时将文件指针释放是一个好主意,正如我们在 cat 中所做的。对输出文件执行 fclose 还有一个原因——它清空(flush)了 putc 所收集的输出缓存。当程序正确结束时,fclose 会被自动调用来关闭每个打开的文件。(如果不需要的话,你可以关闭标准输入和输出。也可以用库函数 freopen 对它们进行重新分配。)


 

7.6 错误处理——stderr 和 exit

cat 中的错误处理不够理想。麻烦在于,如果其中一个文件由于某些原因无法访问,则会在连接输出的末尾打印出诊断信息。如果输出到屏幕,这也许可以接受,但如果输出到文件,或者通过管道输出到另一个程序,就无法接受了。

为了更好地处理这种情况,第二个输出流,称为 stderr,以和 stdin 和 stdout 同样的方式被分配给程序。即使标准输出被重定向了,写到 stderr 的输出也通常显示在屏幕上。

我们来修订 cat ,使其错误信息写到标准输出。

#include <stdio.h>

/* cat: 连接多个文件,第二版 */
main(int argc, char *argv)
{
    FILE *fp;
    void filecopy(FILE *, FILE *);
    char *prog = argv[0];        /* 程序名称,用于错误输出 */

    if (argc == 1)        /* 无参,使用标准输入 */
        filecopy(stdin, stdout);
    else
        while (--argc > 0)
            if ((fp = fopen(*++argv, "r") == NULL) {
                fprintf(stderr, "%s: can't open %s\n", 
                    prog, *argv);
                exit(1);
            } else {
                filecopy(fp, stdout);
                fclose(fp);
            }
    if (ferror(stdout)) {
        fprintf(stderr, "%s: error writing output\n", prog);
        exit(2);
    }
    exit(0);
}

程序以两种方式来指示错误。第一,fprintf 产生的诊断输出发到 stderr,因此会输出到屏幕上,而不是消失到管道中或进入输出文件中。我们在错误消息中包含了来自 argv[0] 都程序名,这样如果程序和其他程序一起使用时,就能识别出错误的源头。

第二,程序使用了标准库函数 exit,当它被调用时会终止程序执行。exit 的参数可以提供给任何调用当前进程的进程,因此把本程序作为子进程的另一个程序可以判断本程序是成功或失败。根据惯例,返回值 0 表示一切正常;非 0 通常表示不正常的情况。exit 会调用 fclose 来关闭每个输出文件,以清空(flush)任何缓存的输出。

在 main 函数中, return expr 等价于 exit(expr)。exit 的优势是它能被 main 之外的其他函数调用,比如可以在第五章的样式搜索程序中找到对 exit 的调用。

如果在流 fp 上出现错误,ferror 函数返回非零。

int ferror(FILE *fp)

尽管输出错误比较少见,但的确也会发生(例如磁盘满),因此用于生产的程序也应当进行检查。

函数 feof(FILE *) 类似 ferror,如果在指定的文件上发生了文件结束,则返回非零。

在这些用于演示的小程序中,我们通常不关心返回状态,但所有认真(serious)的程序都应该返回合理、有用的状态值。
 

  • 15
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值