什么是文件格式
wiki 定义:
A file format is a standard way that information is encoded for storage in a computer file. It specifies how bits are used to encode information in a digital storage medium.
翻译一下:
文件格式是将信息进行编码并存储在计算机文件中的标准方式。它指定如何使用字节来编码信息,并存储在数字存储媒介中。
人话:
就是告诉你数据是怎么存在文件中的。有了文件格式,你就可以将数据写成这种格式的文件,并且将数据从这种格式的文件中读出来。文件格式的本质就是一种协议。
举个例子,word、excel、PPT 就是文件格式,他们按照自己的格式进行组织,计算机中不同的文件后缀就代表不同格式的文件,同样格式的文件的内容可以不同。
开发一种文件格式,一般都需要开发读写接口。最简单的写接口是将一个数据写入到文件中,最简单的读接口就是把里边的所有数据全部读出来(这里的读出来,一般需要以用户可认识的格式读出来。不能用户写了个a,你读出来个#,然后跟用户说 # 就是 a ,这是耍流氓)。
再举例子,word 给人提供了一个界面,让你可以写文字。保存关闭之后再打开。他还能给你展示之前写入的内容,这就是读文件。
文件格式一般包含两部分:data 和 metadata。data 即数据;metadata 即元数据(描述数据的数据),比如这个文件中一共有几条数据,数据的起始位置是多少,长度是多少。
下面介绍一