protobuf笔记

最新推荐文章于 2023-09-07 13:06:59 发布

他过江

最新推荐文章于 2023-09-07 13:06:59 发布

阅读量340

点赞数

分类专栏： Linux C++后台框架文章标签： protobuf

本文链接：https://blog.csdn.net/et_endeavoring/article/details/119121195

版权

Linux C++后台同时被 2 个专栏收录

13 篇文章 2 订阅

订阅专栏

框架

8 篇文章 0 订阅

订阅专栏

官网：

https://developers.google.com/protocol-buffers/docs/proto3

https://developers.google.com/protocol-buffers/docs/encoding

编译安装

wget https://github.com/protocolbuffers/protobuf/archive/refs/tags/v3.17.3.tar.gz
cd protobuf-3.17.3
sh ./autogen.sh
./coufigure –prefix=/usr/local/protobuf-3.17.3
make -j4
sudo make install

标量值类型（Scalar Value Types）

wire type

消息存储格式

protobuf采用TLV格式

Tag 作为该字段的唯一标识
Length 代表 Value 数据域的长度
Value 便是数据本身

只有wire type=2（string等类型）的时候才有length字段

TAG和LENGTH使用Base 128 Varints编码

Varints 用来序列化整型，数字（正数）越小占用的字节数越小，例如1用int表示是4个字节，而用Varints只要1个字节。

Base 128 Varints编码

每个字节都是variant，每个字节最高位是最高有效位（most significant bit (msb)）

msb为1表示还设有下一个字节，为0表示最后一个字节

每个字节后7位表示7位二进制补码

least significant group first个人理解就是小端序，低位字节在低地址，高位字节在高地址。

1的varint编码是：0000 0001

150的varint编码是：1010 1100 0000 0010

150的二进制是1001 0110，由于超过了7位，故要用两个字节表示

下面以消息Test1为例子

message Test1 {
  optional int32 a = 1;
optional string b = 2;
}

int32类型的编码：TAG+VALUE

TAG由两部分组成：field_number+wire_type

field_number即message里等号后面的数字

wire_type共有六种，如上图，故用3位表示即可

所以int32 a = 1;的tag（protobuf中叫做key）值是08

所以假如Test1中a的值是150则编码后的字节流是08 96 01，TAG+VALUE。

string类型的编码

TAG+LENGTH+VALUE

假如Test1中b的值是”ABCD”

则编码后的字节流：

0A 04 41 42 43 44

UTF-8编码

protobuf的字符串用的是UTF8编码，所以下面介绍一下

UTF-8（8-bit Unicode Transformation Format）是一种针对Unicode的可变长度字符编码，也是一种前缀码。由1到4个字节组成，常用汉字一般是3个字节，可能4个字节。ASCII字母继续使用1字节存储，重音文字、希腊字母或西里尔字母等使用2字节来存储，而常用的汉字就要使用3字节。辅助平面字符则使用4字节。