文本化
文本化包含两种设计,一种是将应用数据存储在永久存储器(磁盘等)中文件格式,另一种是在协作进程之间传递数据和命令的应用协议。
存储数据结构的文件格式
通常在C++,python等中,将内存中数据结构的存储为文件的过程称为序列化(列集),将文件中的数据结构恢复到应用程序中的过程称为反序列化(散集)。
数据文件格式与配置文件(运行控制文件)的文件格式之间存在差异,这是因为配置文件通常都是只读文件,而数据文件通常可读可写,另一个方面是因为配置文件通常都是手工编辑,体积很小,而数据文件通常是程序生成,体积多大都有可能。
在数据文件格式设计中最重要的几个指标: 透明性(用户可读),互用性(跨平台),可扩展性,经济型(传输文件大小),建议在经济型不那么重要的情况下尽可能使用文本形式取代二进制形式。
数据文件元格式(几种数据文件格式)
1) DSV风格(Delimiter-Separated Values)
适用场景:当数据为列表,名称为关键字,记录信息通常很短时。如Linux 中/ect/passwd
games: *:12:100:games:/usr/games: