服务之间交互数据有3种选择:
- JSON格式:可读性强、可扩展、容易debug。
- 自定义二进制格式:省流量、解析速度快。缺点是不透明,写解析器麻烦,不好debug,可扩展性差。
- protobuf:比较重量级,生成一大坨源码。学习成本高。支持编程语言有限。修改接口比较麻烦。
实际应用上我是反对使用protobuf,但是JSON格式在流量和解析速度上代价太大。所以我就想是否能有一个格式即有JSON格式的优点,又能省流量和解析速度快。于是诞生了jsonc项目。
原理
大概思路是将JSON压缩为二进制格式,这个二进制和JSON能够互转,并且不损失信息。服务端把所有已有JSON接口的前面封装一层,把JSON转为二进制格式。客户端直接解析二进制格式,而不是JSON。调试的时候把二进制转为人类可读的JSON格式。这样即拥有JSON的所有优点,数据大小减小一半,解析速度快一倍。
实际上我只做了一个朴素的简单实现,如果进一步优化还能更快。数据大小减少除了二进制上扣字节以外。还有就是采用字符串池的形式,把重复的内容进行压缩。
格式
JSON格式有null、布尔型、字符串、数字、数组、对象六种类型。和JSON类似jsonc有下面几种类型:
jc_primi = 0,
jc_int,
jc_float,
jc_array,
jc_object,
jc_string,
jc_ref, //引用常量池种的数据,用来压缩
每个类型占4bit,剩下4bit表示子类型,有下面几种:
jc_null = 0,
jc_true = 1,
jc_false = 2,
//const:0~10, 11:-1, 12:int8, 13:int16, 14:int32,15:int64
jc_int8 = 12,
jc_int16 = 13,
jc_int32 = 14,
jc_int64 = 15,
如果是数字型,则子类型的4bit用来存储实际的值。
更多的细节见https://github.com/chunquedong/jsonc