Thrift二进制序列化协议中,默认为TBinaryProtocol,关于TCompactProtocol的说明,为高效密集型的二进制序列化(varint).那么TCompactProtocol相对于TBinaryProtocol是怎样做到高效密集的呢?TCompactProtocol是否一定比TBinaryProtocol高效?
我们以比较常用的i32类型为例,来解释一下两种方式各自的原理:
TBinaryProtocol
处理i32整型数据类型时,定义的是4个字节的数组,32位的长度正好可以保存到这4个字节组当中.如果我们分别以n1~n32来表示第1位到第32位,那么这个数组的数据结构应该为以下结构:
i32out[0] {n1 ~ n8 }
i32out[1] {n9 ~ n16}
i32out[2] {n17 ~ n24}
i32out[3] {n25 ~ n32}
这样的实现很简单.
对于其它类型,比如i16,也是类似的原理,不过是以2个字节的数组保存,在此不再说明了.
TCompactProtocol
在处理i32整型数据类型时,与TBinaryProtocol完全不同,采用的是1~5个字节组来保存.依然以n1~n32来表示第1位到第32位,数据结构应该为以下结构:
i32out[0] {1 , 0 , 0 , 0 , n1 ~ n4}
i32out[1] {1 , n5 ~ n11}
i32out[2] {1 , n12 ~ n18}
i32out[3] {1 , n19 ~ n25}
i32out[4] {0 , n26 ~ n32}
这是一种极端情况,5个字节全部占满.
很显然,这样做比TBinaryProtocol复