Protobuf 二进制文件学习及解析

0. 简介

protobuf也叫protocol buffer是google 的一种数据交换的格式,它独立于语言,独立于平台。google 提供了多种语言的实现:java、c#、c++、go 和 python,每一种实现都包含了相应语言的编译器以及库文件。

由于它是一种二进制的格式,比使用 xml 、json进行数据交换快许多。可以把它用于分布式应用之间的数据通信或者异构环境下的数据交换。作为一种效率和兼容性都很优秀的二进制数据传输格式,可以用于诸如网络传输、配置文件、数据存储等诸多领域。

更多详情请看:https://developers.google.com/protocol-buffers/docs/overview

1. 基础语法

1 字段限制

required: 必须赋值的字符
optional: 可有可无的字段,可以使用[default = xxx]配置默认值
repeated: 可重复变长字段,类似数组

2 tag

每个字段都有独一无二的tag
tag 1-15是字节编码,16-2047使用2字节编码,所以1-15给频繁使用的字段

3 类型

在这里插入图片描述

系统默认值:
string默认为空字符串;
bool默认为false;
数值默认为0;
enum默认为第一个元素

4 解析与序列化

每个message都包含如下方法,用于解析和序列化,注意目标是字节形式,非文本。
bool SerializeToString(string* output) const: 将message序列化成二进制保存在output中,注意保存的是二进制,不是文本;仅仅是string作为容器。
bool ParseFromString(const string& data): 从给定的二进制数值中解析成message
bool SerializeToOstream(ostream* output) const: 序列化到ostream中
bool ParseFromIstream(istream* input): 从istream中解析出message

3. 讲解举例

建立.proto文件
syntax = "proto3";//指定版本信息,不指定会报错message Person //message为关键字,作用为定义一种消息类型{    string name = 1;    //姓名    int32 id = 2;       //id    string email = 3;   //邮件}message AddressBook{    repeated Person people = 1;}
字段API

一般我们会经常使用protoc来自动生成:

protoc -I=$SRC_DIR --cpp_out=$DST_DIR $SRC_DIR/addressbook.proto

其中protoc工具地址:protoc

而对于字段修饰符为repeated的字段生成的函数,则稍微有一些不同,如people字段,则编译器会为其产生如下的代码:

int people_size() const;void clear_people();const ::Person& people(int index) const;::Person* mutable_people(int index);::Person* add_people();::google::protobuf::RepeatedPtrField< ::Person >* mutable_people();const ::google::protobuf::RepeatedPtrField< ::Person >& people() const;
测试程序
void set_addressbook(){    AddressBook obj;    Person *p1 = obj.add_people(); //新增加一个Person    p1->set_name("mike");    p1->set_id(1);    p1->set_email("mike@qq.com");    Person *p2 = obj.add_people(); //新增加一个Person    p2->set_name("jiang");    p2->set_id(2);    p2->set_email("jiang@qq.com");    Person *p3 = obj.add_people(); //新增加一个Person    p3->set_name("abc");    p3->set_id(3);    p3->set_email("abc@qq.com");    fstream output("pb.xxx", ios::out | ios::trunc | ios::binary);    bool flag = obj.SerializeToOstream(&output);//序列化    if (!flag)    {        cerr << "Failed to write file." << endl;        return;    }    output.close();//关闭文件}void get_addressbook(){    AddressBook obj;    fstream input("./pb.xxx", ios::in | ios::binary);    obj.ParseFromIstream(&input);  //反序列化    input.close(); //关闭文件    for (int i = 0; i < obj.people_size(); i++)    {        const Person& person = obj.people(i);//取第i个people        cout << "第" << i + 1 << "个信息\n";        cout << "name = " << person.name() << endl;        cout << "id = " << person.id() << endl;        cout << "email = " << person.email() << endl << endl;    }}
运行结果:

在这里插入图片描述

点击https://www.guyuehome.com/36919可查看全文
  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
protobuf中,可以使用bytes类型来存放二进制文件数据protobuf是一种用于序列化结构化数据的开源库,它可以将结构化数据转换为二进制格式,以便在网络传输或存储时使用。 在protobuf中,bytes类型是一种特殊的数据类型,用于存储任意二进制数据。它可以用来表示图片、音频、视频等二进制文件的内容。在.proto文件中定义消息类型时,可以使用bytes类型来声明一个字段,例如: message MyMessage { bytes file_data = 1; } 在上面的例子中,MyMessage消息类型包含一个名为file_data的字段,它的类型是bytes。这个字段可以用来存储二进制文件的内容。 当使用protobuf编码器将结构化数据编码为二进制格式时,可以将二进制文件的内容赋值给bytes类型的字段。例如,在C++中使用protobuf库编码时,可以使用以下代码: MyMessage message; message.set_file_data(file_content, file_size); 在上面的代码中,file_content是一个指向二进制文件内容的指针,file_size是文件的大小。通过调用set_file_data函数,将文件内容赋值给file_data字段。 当使用protobuf解码器将二进制数据解码为结构化数据时,可以通过访问bytes类型的字段来获取二进制文件的内容。例如,在C++中使用protobuf库解码时,可以使用以下代码: const std::string& file_data = message.file_data(); // 使用file_data进行后续处理 在上面的代码中,通过访问file_data字段,可以获取存储在其中的二进制文件内容,并进行后续处理。 需要注意的是,protobuf并不会对二进制文件的内容进行任何处理或解析,它只是将二进制数据存储在bytes类型的字段中。因此,在使用protobuf存储二进制文件时,需要确保正确地读取和写入文件内容。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值