Apollo学习笔记（3） Protocol Buffer语法

碎步の流年

已于 2023-06-28 18:01:21 修改

阅读量1.1k

点赞数 2

分类专栏： Apollo 文章标签：学习笔记

于 2020-06-29 19:12:20 首次发布

本文链接：https://blog.csdn.net/qq_24649627/article/details/106998620

版权

Apollo 专栏收录该内容

29 篇文章 122 订阅

订阅专栏

构建Protocol Buffer 的消息对象步骤

在这里插入图片描述

详细介绍

实例说明：构建一个Person类的数据结构，包含成员变量name、id、email等等，具体类包含变量如下：

// c++类
public class Person
{   
    private String name;    
    private Int id;    
    private String email;
...
}

通过 Protocol Buffer 语法描述需要存储的数据结构
新建一个文件，命名规则为：文件名 = 类名，后缀为 .proto，此处叫Demo.proto
根据上述数据结构的需求，在Demo.proto里通过 Protocol Buffer 语法写入对应 .proto对象模型的代码，如下：

// 定义proto版本
syntax = "proto2";

// 关注1：包名
package protocobuff_Demo;

// 关注2：option选项
option cc_package = "com.carson.proto";
option cc_outer_classname = "Demo";

// 关注3：消息模型
// 下面详细说明
// 生成 Person 消息对象（包含多个字段，下面详细说明）
message Person 
{  
    required string name = 1;
    required int32 id = 2;  
    optional string email = 3;  
    
    enum PhoneType 
    {    
        MOBILE = 0;    
        HOME = 1;    
        WORK = 2;  
    }  
    
    message PhoneNumber 
    {    
        required string number = 1;    
        optional PhoneType type = 2 [default = HOME];  
    }  
    
    repeated PhoneNumber phone = 4;
}

message AddressBook 
{  
    repeated Person person = 1;
}

下面将结合上述例子对 Protocol Buffer 语法进行详细介绍：

关注1：包名

在这里插入图片描述

// 关注1：包名
package protocobuff_Demo;

作用：防止不同 .proto 项目间命名发生冲突
Protocol buffer 的类型名称解析与 C++ 一致：从最内部开始查找，依次向外进行,每个包会被看作是其父类包的内部类

Protocol buffer 编译器会解析 .proto文件中定义的所有类型名，生成器会根据不同语言生成对应语言的代码文件：
即对不同语言使用了不同的规则进行处理， Protoco Buffer提供 C++、Java、Python 三种语言的 API。

关注2：Option选项

// 关注2：option选项
option cc_package = "com.carson.proto";
option cc_outer_classname = "Demo";

作用：影响特定环境下的处理方式，但不改变整个文件声明的含义

常用Option选项如下：

 option cc_package = "com.carson.proto";
// 定义：c++包名
// 作用：指定生成的类应该放在什么Java包名下
// 注：如不显式指定，默认包名为：按照应用名称倒序方式进行排序

option cc_outer_classname = "Demo";
// 定义：类名
// 作用：生成对应.pb.h 文件的类名（不能跟下面message的类名相同）
// 注：如不显式指定，则默认为把.proto文件名转换为首字母大写来生成
// 如.proto文件名="my_proto.proto"，默认情况下，将使用 "MyProto" 做为类名

option optimize_for = ***;
// 作用：影响 C++  & java 代码的生成
// ***参数如下：
// 1. SPEED (默认):：protocol buffer编译器将通过在消息类型上执行序列化、语法分析及其他通用的操作。（最优方式）
// 2. CODE_SIZE:：编译器将会产生最少量的类，通过共享或基于反射的代码来实现序列化、语法分析及各种其它操作。  
// 特点：采用该方式产生的代码将比SPEED要少很多， 但是效率较低；  
// 使用场景：常用在 包含大量.proto文件 但 不追求效率 的应用中。
// 3.  LITE_RUNTIME:：编译器依赖于运行时 核心类库 来生成代码（即采用libprotobuf-lite 替代libprotobuf）。  
// 特点：这种核心类库要比全类库小得多（忽略了 一些描述符及反射 ）；编译器采用该模式产生的方法实现与SPEED模式不相上下，产生的类通过实现 MessageLite接口，但它仅仅是Messager接口的一个子集。  
// 应用场景：移动手机平台应用

option cc_generic_services = false;
option java_generic_services = false;
option py_generic_services = false;
// 作用：定义在C++、java、python中，protocol buffer编译器是否应该基于服务定义产生抽象服务代码（2.3.0版本前该值默认 = true）
// 自2.3.0版本以来，官方认为通过提供代码生成器插件来对RPC实现更可取，而不是依赖于“抽象”服务

optional repeated int32 samples = 4 [packed=true];
// 如果该选项在一个整型基本类型上被设置为真，则采用更紧凑的编码方式（不会对数值造成损失）
// 在2.3.0版本前，解析器将会忽略 非期望的包装值。因此，它不可能在不破坏现有框架的兼容性上而改变压缩格式。
// 在2.3.0之后，这种改变将是安全的，解析器能够接受上述两种格式。

optional int32 old_field = 6 [deprecated=true];
// 作用：判断该字段是否已经被弃用
// 作用同 在java中的注解@Deprecated

在 ProtocolBuffers 中允许自定义选项并使用，该功能属于高级特性，使用频率很低，此处不过多描述。有兴趣可查看官方文档。

关注3：消息模型

作用：真正用于描述数据结构
// 消息对象用message修饰

message Person 
{  
    required string name = 1;  
    required int32 id = 2;  
    optional string email = 3;  
    enum PhoneType 
    {    
        MOBILE = 0;
       HOME = 1;    
       WORK = 2;  
   }
   
   message PhoneNumber 
   {    
       optional PhoneType type = 2 [default = HOME];  
   }     
   repeated PhoneNumber phone = 4;
}

message AddressBook 
{  
    repeated Person person = 1;
}

组成：在 ProtocolBuffers 中：
a. 一个 .proto 消息模型 = 一个 .proto文件 = 消息对象 + 字段
b. 一个消息对象（Message） = 一个结构化数据
c. 消息对象（Message）里的字段 = 结构化数据里的成员变量

下面会详细介绍 .proto 消息模型里的消息对象 & 字段

在这里插入图片描述

3.1. 消息对象

在 ProtocolBuffers 中：

一个消息对象（Message） = 一个结构化数据
消息对象用修饰符 message 修饰
消息对象含有字段：消息对象（Message）里的字段 = 结构化数据里的成员变量

在这里插入图片描述
特别注意：

在一个 .proto文件中定义多个消息对象
应用场景：尽可能将与某一消息类型对应的响应消息格式定义到相同的 .proto文件中。
实例：

message SearchRequest
{  
    required string query = 1;  
    optional int32 page_number = 2;  
    optional int32 result_per_page = 3;
}

// 与SearchRequest消息类型 对应的 响应消息类型
SearchResponsemessage SearchResponse
{
    ...
}

一个消息对象里可以定义另外一个消息对象（即嵌套）

message Person 
{  
    required string name = 1;  
    required int32 id = 2;  
    optional string email = 3;
    
    // 该消息类型 定义在 Person消息类型的内部
    // 即Person消息类型 是 PhoneNumber消息类型的父消息类型  
    message PhoneNumber
   {
        required string number = 1;  
   }
}

<-- 多重嵌套 -->
message Outer 
{   
    // Level 0  
    message MiddleAA 
    {  
        // Level 1    
        message Inner 
        {   
            // Level 2      
            required int64 ival = 1;      
            optional bool  booly = 2;    
        }  
    }
}

3.2. 字段

消息对象的字段组成主要是：字段 = 字段修饰符 + 字段类型 +字段名 +标识号

下面将对每一项详细介绍：

字段修饰符
作用：设置该字段解析时的规则，具体类型如下：
字段类型主要有三类：

基本数据类型
枚举类型
消息对象类型

message Person 
{  
    // 基本数据类型 字段  
    required string name = 1;  
    required int32 id = 2;  
    optional string email = 3;  
    enum PhoneType 
    {    
        MOBILE = 0;    
       HOME = 1;    
       WORK = 2;  
   }  
   
   message PhoneNumber 
   {    
       optional PhoneType type = 2 [default = HOME];    
       // 枚举类型 字段  
   }  
   
   repeated PhoneNumber phone = 4;  // 消息类型 字段
}

字段基本数据类型

.proto基本数据类型对应于各平台的基本数据类型如下：
在这里插入图片描述
字段枚举类型

作用：为字段指定一个可能取值的字段集合，该字段只能从该指定的字段集合里取值
如下面例子，电话号码可能是手机号、家庭电话号或工作电话号的其中一个，那么就将PhoneType定义为枚举类型，并将加入电话的集合（ MOBILE、 HOME、WORK）

// 枚举类型需要先定义才能进行使用

// 枚举类型 定义 
enum PhoneType 
{    
    MOBILE = 0;    
    HOME = 1;    
    WORK = 2;       
    // 电话类型字段只能从这个集合里取值  
}
// 特别注意：
// 1. 枚举类型的定义可在一个消息对象的内部或外部
// 2. 都可以在 同一.proto文件 中的任何消息对象里使用
// 3. 当枚举类型是在一消息内部定义，希望在另一个消息中使用时，需要采用MessageType.EnumType的语法格式  

message PhoneNumber 
{    
    required string number = 1;    
    optional PhoneType type = 2 [default = HOME];    
    // 使用枚举类型的字段（设置了默认值）  
}
// 特别注意：
// 1.  枚举常量必须在32位整型值的范围内
// 2. 不推荐在enum中使用负数：因为enum值是使用可变编码方式的，对负数不够高效

额外说明：
当对一个使用了枚举类型的.proto文件使用 Protocol Buffer编译器编译时，生成的代码文件中：

对 Java 或 C++来说，将有一个对应的 enum 文件
对 Python 来说，有一个特殊的EnumDescriptor 类

被用来在运行关于字段的高级用法关于字段的高级用法时生成的类中创建一系列的整型值符号常量（symbolic constants）

字段消息对象类型

一个消息对象可以将其他消息对象类型用作字段类型，情况如下：
在这里插入图片描述

使用同一个 .proto 文件里的消息类型
1.a. 使用内部消息类型
目的：先在消息类型中定义其他消息类型，然后再使用，即嵌套，需要用作字段类型的消息类型定义在该消息类型里

message Person 
{  
    required string name = 1;  
    required int32 id = 2;  
    optional string email = 3;
    // 该消息类型 定义在 Person消息类型的内部
    // 即Person消息类型 是 PhoneNumber消息类型的父消息类型  
    
    message PhoneNumber
   {    
       required string number = 1;  
   }  
   
   repeated PhoneNumber phone = 4;  
   // 直接使用内部消息类型
}

1.b. 使用外部消息类型

即外部重用，需要用作字段类型的消息类型定义在该消息类型外部

 message Person 
 {  
     required string name = 1;  
     required int32 id = 2;  
     optional string email = 3;
 }

 message AddressBook 
 {
   repeated Person person = 1;  
   // 直接使用了 Person消息类型作为消息字段
}

1.c. 使用外部消息的内部消息类型

 message Person 
 {  
     required string name = 1;  
     required int32 id = 2;  
     optional string email = 3;
    
     // PhoneNumber消息类型是 Person 消息类型的内部消息类型  
     message PhoneNumber 
     {    
        required string number = 1;    
        optional PhoneType type = 2 [default = HOME];  
    }
}

// 若父消息类型外部的消息类型需要重用该内部消息类型，需要以 Parent.Type 的形式去使用 
// Parent = 需要使用消息类型的父消息类型，Type = 需要使用的消息类型

// PhoneNumber父消息类型 Person 的外部 OtherMessage 消息类型需要使用 PhoneNumber 消息类型
message OtherMessage 
{  
    optional Person.PhoneNumber phonenumber = 1;
    // 以 Parent.Type = Person.PhoneNumber 的形式去使用
}

使用不同 .proto 文件里的消息类型
目的：需要在 A.proto文件使用 B.proto文件里的消息类型
解决方案：在 A.proto文件通过导入（ import） B.proto文件中来使用 B.proto文件里的消息类型

import "myproject/other_protos.proto"
// 在 A.proto 文件中添加 B.proto文件路径的导入声明
// ProtocolBuffer编译器会在该目录中查找需要被导入的 .proto文件
// 如果不提供参数，编译器就在其调用的目录下查找

当然，在使用不同 .proto 文件里的消息类型时也会存在想使用同一个 .proto 文件消息类型的情况，但使用都是一样，此处不作过多描述。

将消息对象类型用在 RPC（远程方法调用）系统
解决方案：在 .proto 文件中定义一个 RPC 服务接口，Protocol Buffer编译器会根据所选择的不同语言平台生成服务接口代码，由于使用得不多，此处不作过多描述，具体请看文档

字段名
该字段的名称，此处不作过多描述。

标识号

作用：通过二进制格式唯一标识每个字段

一旦开始使用就不能够再改变
标识号使用范围：[1,2的29次方 - 1]
不可使用 [19000－19999] 标识号，因为 Protobuf 协议实现中对这些标识号进行了预留。假若使用，则会报错

编码占有内存规则：每个字段在进行编码时都会占用内存，而占用内存大小取决于标识号：

范围 [1,15] 标识号的字段在编码时占用1个字节；
范围 [16,2047] 标识号的字段在编码时占用2个字节；

使用建议

为频繁出现的消息字段保留 [1,15] 的标识号
为将来有可能添加的、频繁出现的消息字段预留 [1,15] 标识号

3.3. 关于字段的高级用法

在这里插入图片描述

更新消息对象的字段
目的：为了满足新需求，需要更新消息类型而不破坏已有消息类型代码，即新、老版本需要兼容
更新字段时，需要符合下列规则：
扩展消息对象的字段
作用：使得其他人可以在自己的 .proto 文件中为该消息对象声明新的字段而不必去编辑原始文件，扩展可以是消息类型也可以是字段类型
以下以扩展消息类型为例：

A.proto

message Request 
 {
     …  
     extensions 100 to 199;  
     // 将一个范围内的标识号声明为可被第三方扩展所用  
     // 在消息Request中，范围 [100,199] 的标识号被保留为扩展用  
     // 如果标识号需要很大的数量时，可以将可扩展标符号的范围扩大至max  
     // 其中max是2的29次方 - 1（536,870,911）。  
 }

// or
message Request 
{    
    extensions 1000 to max;  
    // 注：请避开[19000－19999] 的标识号，因为已被Protocol Buffers实现中预留
}

现在，其他人就可以在自己的 .proto文件中添加新字段到Request里。如下：

B.proto

extend Request 
{  
    optional int32 bar = 126;  
    // 添加字段的 标识号必须要在指定的范围内  
    // 消息Request 现在有一个名为 bar 的 optional int32 字段  
    // 当Request消息被编码时，数据的传输格式与在Request里定义新字段的效果是完全一样的  
    // 注：在同一个消息类型中一定要确保不会扩展新增相同的标识号，否则会导致数据不一致；可以通过为新项目定义一个可扩展标识号规则来防止该情况的发生
}

要访问扩展字段的方法与访问普通的字段不同：使用专门的扩展访问函数
实例：

// 如何在C++中设置 bar 值
Request request;
request.SetExtension(bar, 15);
// 类似的模板函数 HasExtension()，ClearExtension()，GetExtension()，MutableExtension()，以及 AddExtension()
// 与对应的普通字段的访问函数相符

嵌套的扩展

可以在另一个消息对象里声明扩展，如：

 message Carson 
 {  
     extend Request 
     {    
         optional int32 bar = 126;  
     }  
     …
 }

// 访问此扩展的C++代码：
Request request;
request.SetExtension(Baz::bar, 15);

对于嵌套的使用，一般的做法是：在扩展的字段类型的范围内定义该扩展

实例：一个 Request 消息对象需要扩展（扩展的字段类型是Car 消息类型），那么，该扩展就定义在 Car消息类型里：

message Car 
{  
    extend Request 
    {    
        optional Car request_ext = 127;
        // 注：二者并没有子类、父类的关系  
    }
}

至此，Protoco Buffer的语法已经讲解完毕。

通过 Protocol Buffer 编译器编译 .proto 文件

作用：将 .proto 文件转换成对应平台的代码文件，Protoco Buffer提供 C++、Java、Python 三种开发语言的 API
具体生成文件与平台有关：
在这里插入图片描述

编译指令说明：

// 在 终端 输入下列命令进行编译
 protoc -I=$SRC_DIR --xxx_out=$DST_DIR $SRC_DIR/addressbook.proto
 // 参数说明
 // 1. $SRC_DIR：指定需要编译的.proto文件目录 (如没有提供则使用当前目录)
 // 2. --xxx_out：xxx根据需要生成代码的类型进行设置
 // 对于 Java ，xxx =  java ，即 -- java_out
 // 对于 C++ ，xxx =  cpp ，即 --cpp_out
 // 对于 Python，xxx =  python，即 --python_out
 // 3. $DST_DIR ：编译后代码生成的目录 (通常设置与$SRC_DIR相同)
// 4. 最后的路径参数：需要编译的.proto 文件的具体路径

// 编译通过后，Protoco Buffer会根据不同平台生成对应的代码文件

具体实例:

// 编译说明
// 1. 生成Java代码
// 2. 需要编译的.proto文件在桌面，希望编译后生成的代码也放在桌面
protoc -I=/Users/Carson_Ho/Desktop --cpp_out=/Users/Carson_Ho/Desktop /Users/Carson_Ho/Desktop/Demo.proto
// 编译通过后，Protoco Buffer会按照标准cpp风格，生成cpp类及目录结构

更多的编译功能，请参阅官方文档。

碎步の流年

关注

2
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
Apollo学习笔记（3） Protocol Buffer语法

构建Protocol Buffer 的消息对象步骤详细介绍实例说明：构建一个Person类的数据结构，包含成员变量name、id、email等等，具体类包含变量如下：// c++类public class Person{ private String name; private Int id; private String email;...}通过 Protocol Buffer 语法描述需要存储的数据结构新建一个文件，命名规则为：文
复制链接

扫一扫