为什么文件含有的字符数多了一？

最新推荐文章于 2022-06-11 10:08:24 发布

FitzLeopard

最新推荐文章于 2022-06-11 10:08:24 发布

阅读量584

点赞数 1

分类专栏：杂文

杂文专栏收录该内容

2 篇文章 0 订阅

订阅专栏

为什么文件含有的字符数多了一？

在阅读《The C Programming Language》(2nd Edition)(俗称K&R)时，动手实现了书中的部分示例代码，结果出现了一个问题，在Stackoverflow上进行了问询才得到了解决，由于原题是英文，故翻译成博文与大家分享。

原文链接：Why does the file created using a text editor contain one byte more than expected?

问题描述：

Vim中创建一个文件如下：

a v

bb

e

并且在创建文件的末尾一行时，输入e之后，没有按回车键。

那么分析一下这个文件应该含有那些字符呢？

第一行应该有这样四个字符：'a',' ','v','\n'

第二行应该有这样三个字符：'b','b','\n'

第三行应该有一个字符：'e'

注意我们分析的依据是：创建文件的末尾一行时，输入e之后，没有按回车键。 故没有\n' 字符在最后一行结尾。那么现在文件中应该一共有８个字符，我们使用K&R中的计数字符数量的示例代码进行计数：

#include<stdio.h>

/* count characters in input; 1st version */
int main()
{
    long nc;

    nc = 0;
    while (getchar() != EOF) {
        ++nc;
    }
    printf("%ld\n", nc);

    return 0;
}

结果是９。

甚至我们可以使用bash命令wc 来进行计数，最后的结果还是９．

为什么呢？

解答：

在计算机科学的传统中，我们倾向于让文件中的每一行都以一个'\n' 字符结尾，也因此，许多流行的，常用的文本编辑器，如Vim, Gvim, Nano, Gedit都会自动在文件结尾加入一个'\n' 字符，无论文件的最后是不是'\n'字符。这也就解释了为什么字符数量是９．因为Vim自动增加了一个'\n'字符。

想要真正的可视化一个文件中的所有字符，我们可以在Linux下使用hexdump -C命令，如下

$ hexdump -C test
00000000  61 20 76 0a 62 62 0a 65  0a                       |a v.bb.e.|
00000009

为什么文件含有的字符数多了一？

为什么文件含有的字符数多了一？

问题描述：

解答：

延伸阅读