程序员进行的是面向知识的工作——收集需求,将之变成知识 。程序(源文件或脚本)、配置和各种文档,都是这些知识的表达。实践证明,持久地存储知识的最佳格式是纯文本(Plain Text) ,通常不是二进制文件。
纯文本的优点
1. 保证不过时
对于二进制文件,数据的含义被封装在了解析文件的程序中,也就是人为地使数据与其含义分离开来;如果没有指定的程序来解析,数据文件将没有任何意义。对于纯文本文件,则很容易创建自描述的数据流;这种人可以阅读的(human readable)信息格式,可以比任何创建它们的应用程序都活得更久。
乍听起来似乎有点不可思议(尤其是对于经常随意用邮件发出去一个明天就不再有用的Office文档附件的人们来说),但事实确实如此。你很可能需要去解析一个来自上世纪80、90年代的遗留系统的数据文件,如果它们是用DSV或SGML的文本形式存储,你容易从中发掘数据的含义;想象一下如果它们是Wordstar或CCED的文件格式。
同样可以想象,当MS Office 2003下市以后,doc/xls/ppt都将是向后兼容的遗留文件格式。如果你的信息保存在这些文件中,你只能祈求未来的Office版本不要放弃对这些文件格式的兼容。
2. 扩展性好
二进制格式经常设定了数据值的位数,要扩展位数将非常困难。比如为地址分配32位的IPv4如今面临的问题。相反,如果在文本格式中需要更大的值,直接写就行;也许应用程序暂时无法解析这些更大的值,但与修改所有相关数据文
纯文本的威力
最新推荐文章于 2021-04-13 12:25:12 发布
本文探讨了纯文本文件在存储知识方面的优势,如保证不过时、扩展性好和使用各种工具的便利性,同时也提到了其存储空间较大和处理性能的劣势。纯文本在配置文件、文档编辑等方面对比二进制格式有显著优势,尤其是在长期存储和跨平台兼容性方面。
摘要由CSDN通过智能技术生成