一 简介
Google Protocol Buffer( 简称 Protobuf) 是 Google 公司内部的混合语言数据标准,目前已经正在使用的有超过 48,162 种报文格式定义和超过 12,183 个 .proto 文件。他们用于 RPC 系统和持续数据存储系统。
Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,或者说序列化。它很适合做数据存储或 RPC 数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C++、Java、Python 三种语言的 API。
二 python接口的简单使用
(1)编写test.proto文件,定义需要处理的结构化数据,在protobuf中,称之为'message'
syntax = "proto2";
package hello_world;#包的名称
message SayHi {
required int32 id = 1;
required string something = 2;
optional string extra_info = 3;
}
(2)用protoc编译该.proto文件,C++中会生成hello_world.SayHi.pb.c和hello_world.SayHi.pb.h文件,Python中会生成test_pb2.py文件。
protoc -I . --python_out=. test.proto
(3)导入生成的test_pb2.py文件,即可按照test.proto文件定义的结构将数据序列化为字符串(如:序列化后写入磁盘),
使用序列化的数据时,可按照定义的结构反序列化(从磁盘读取)。
# coding: utf-8
import test_pb2
po = test_pb2.SayHi()
po.id = 123
po.something = 'do_something'
po.extra_info = 'another_thing'
biu = po.SerializeToString()#序列化为字符串
oo = test_pb2.SayHi()
oo.ParseFromString(biu)#反序列化
print oo.id
print oo.something
print oo.extra_info
输出:
123
do_something
another_thing