protobuf底层编码格式一览

最新推荐文章于 2024-10-12 20:59:58 发布

saddlesad

最新推荐文章于 2024-10-12 20:59:58 发布

阅读量1k

点赞数

分类专栏： protobuf CPP 文章标签： c++ c语言开发语言

本文链接：https://blog.csdn.net/saddlesad/article/details/121581011

版权

本文详细介绍了protobuf的底层编码格式，包括varint编码（用于小整数，节省空间），32-bit/64-bit定长编码（用于固定长度数据），以及length-delimited编码（用于可变长度数据和嵌套消息）。protobuf的编码规则是Tag + (Length +) Value，其中Tag由field_num和wire_type组合而成。文章还提及了ZigZag编码用于优化sint32/sint64类型的负数表示，以及编码实例来辅助理解。

摘要由CSDN通过智能技术生成

protobuf底层编码格式

首先要认识protobuf支持的几种编码方式和它们对应的数据类型：

wire-type	meaning	used for
0	varint	int32, int64, uint32, uint64, sint32, sint64, bool, enum
1	64-bit	fixed64, sfixed64, double
2	length-delimited	string, bytes, embedded messages, packed repeated fields
5	32-bit	fixed32, sfixed32, float

值为3和4的wire-type分别是start group和end group，它们现在已被废弃

protobuf使用的编码方式可以简记为TLV：Tag + (Length +) Value。

Tag的定义是：field_num << 3 | wire_type，这个field_num就是.proto文件中字段的编号。

举个例子，如果你有一个.proto文件如下：

message pod {
	optional int32 a = 1;
	optional string str = 2;
	repeated sint32 vec = 3;
}

那么三个字段编码后的tag如下（二进制格式）：

a: 00001 000 // field_num = 1, wire_type = 0
str: 00010 010 // field_num = 2, wire_type = 2
vec: 00010 011

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

saddlesad

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

数据格式之protobuf

qq_43186092的博客

04-30

462

简介二进制数据交换格式基于idl语言自动生成对应的数据结构代码 protobuf开发流程搭建环境编写IDL文件（.proto文件）根据IDL文件生成对应语言的数据结构代码使用相应的工具包完成序列化和反序列化环境搭建安装protoc 下载protoc-3.6.1-osx-x86_64.zip文件并解压 cd protoc-3.6.1-osx-x86_64 cp -r i...

protobuf底层原理深度分析

weixin_44545838的博客

06-16

3327

前面利用的到protobuf作为rpc的通讯协议，c++与golang利用protobuf进行通讯但是没有真正得深入研究过。本文将不再介绍如何使用它而是深入研究protobuf协议，本文从编解码方式、数据存储方式以及序列化原理三个方面出发深度分析其底层原理。

参与评论您还未登录，请先登录后发表或查看评论

深入 ProtoBuf - 编码

whl0071的专栏

06-05

959

深入 ProtoBuf - 编码

rpc中常用的数据格式：Protobuf 图文详解

最新发布

yzfzzz的博客

10-12

1116

protobuf也叫protocol buffer，是google 的一种数据交换的格式，它跨语言、跨平台。可以实现多种语言文件的数据传输实现（java、c#、c++、go 和 python 等），如一个cpp程序和一个python程序的数据传输。由于它是一种二进制的格式，比使用 xml 、json进行数据交换快许多。所以它的效率和兼容性都很优秀，可以把它用于分布式应用之间的数据通信。test.pb.h初看有些复杂，但其实都是有规律的。

Google Protobuf 协议分析

ve12345的博客

12-22

2300

protobuf 是google开源的一个序列化框架，类似xml，json，最大的特点是基于二进制，比传统的XML表示同样一段内容要短小得多。还可以定义一些可选字段，用于服务端与客户端通信。前面几篇文章说了protobuf的用法，看到网上也没有分析protobuf协议的文章，就利用一些时间写了protobuf 的协议分析，希望大家喜欢。 protobuf协议核心思想基于128bits的数值存储...

Protobuf

weixin_60208935的博客

10-06

2534

本专栏RPC项目使用数据压缩编码方式为Protobuf。Protocol buffers 是一种语言中立，平台无关，可扩展的序列化数据的格式，可用于通信协议，数据存储等。Protocol buffers 在序列化数据方面，它是灵活的，高效的。相比于XML 来说，Protocol buffers 更加小巧，更加快速，更加简单。一旦定义了要处理的数据的数据结构之后，就可以利用 Protocol buffers 的代码生成工具生成相关的代码。甚至可以在无需重新部署程序的情况下更新数据结构。

protobuf消息格式

neuzhangno的博客

01-14

170

protobuf，消息

[转] Protobuf高效结构化数据存储格式

木牛的博客

10-19

1064

不过好像只能import当前目录及当前目录的子目录中的proto文件，比如import父目录中的文件时编译会报错（Import "../xxxx.proto" was not found or had errors.），使用绝对路径也不行，尚不清楚原因，官方文档说使用 -I=PATH 或者 --proto_path=PATH 来指定import目录，但实际实验结果表明这两种方式指定的是将要编译的proto文件所在的目录，而不是import的文件所在的目录。//输出到string。//从string解析。

Protobuf 学习简记（一）Protobuf文件格式

天富儿的博客

02-23

1819

Protobuf是Protocol Buffers的简称，它是Google公司开发的一种数据描述语言，用于描述一种轻便高效的结构化数据存储格式，并于2008年对外开源。Protobuf可以用于结构化数据串行化，或者说序列化。它的设计非常适用于在网络通讯中的数据载体，很适合做数据存储或 RPC 数据交换格式，它序列化出来的数据量少再加上以 K-V 的方式来存储数据，对消息的版本兼容性非常强，可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。

浅谈 Protobuf 编码

腾讯技术工程

07-14

1179

作者：SG4YK，腾讯 PCG 后台开发工程师近日简单学习了 Protobuf 中的编码实现，总结并整理成文。本文结构总体与 Protobuf 官方文档相似，不少内容也来自官方文档，并在官...

如何在PHP环境中使用ProtoBuf数据格式

10-15

随着gRPC框架的成熟和使用人群的增加，对于底层使用的数据格式protobuf也越来越受到重视。对于PHP生态而言，相关ProtoBuf介绍文档及使用资料比较少，所以这篇文章的出现，能够帮助一些有需要的同学。 ProtoBuf...

protobuf编码源码和demo实现参考

12-15

1. 数据序列化和反序列化机制：了解protobuf如何将结构化数据转换为二进制格式，以及如何从二进制数据恢复原始数据。 2. .proto文件：学习如何编写.proto文件，定义消息类型和字段。 3. 编译器：掌握protobuf编译器...

protobuf 格式分析

specialsun的专栏

05-27

619

protobuf 是谷歌出品一款高性能序列化框架，优点序列化后报文数据小，支持多种多种编程语言（c/c++，java，php，python等主流语言），缺点二进制不可读这倒不重要。一. 安装下载源码编译二. 开发流程 2.1 准备helloworld.proto文件 package com; message helloworld{ requir...

protobuf 详解

wsnbb_2023的博客

07-08

707

Protobuf是Protocol Buffers的简称，它是Google公司开发的一种数据描述语言，是一种轻便高效的结构化数据存储格式，可以用于结构化数据串行化，或者说序列化。它很适合做数据存储或 RPC 数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C++、Java、Python 三种语言的 API。protobuf是类似与json一样的数据描述语言（数据格式）protobuf非常适合于RPC数据交换格式protobuf本身并不是和。

ProtoBuf格式详解

协议分析与还原

09-17

7364

“介绍protobuf编码格式。”protobuf是一种数据交换格式，又称PB编码，由Google开源，类似于Json、XML，但其内部是纯二进制格式，比Json，XML...

Protobuf与gRPC

mzman的博客

12-18

1243

Protobuf与gRPC学习总结与课程报告

Protobuf编码和存储方式

for_forever_的博客

05-21

458

protubuf编码方式存储方式

Protobuf编码规则详解

mijichui2153的博客

12-23

8076

一、基础 1、序列化与反序列化序列化：指将结构化的数据按一定的编码规范转成指定格式的过程；反序列化：指将转成指定格式的数据解析成原始的结构化数据的过程；举个例子：Person是一个表示人的对象类型，person是一个Person类型的对象，将person存到一个对应的XML文档中的过程就是一种序列化，而解析XML生成对应Person类型对象person的过程，就是一个反序列化的过程。在这里结构化数据指的就是Person类型的数据，一定的编码规范指的就是XML文档的规范。XML是一种简单的序列化

protobuf编码格式详解

10-18

Protobuf是一种轻量级的数据交换格式，它的编码格式是二进制的，相比于XML和JSON等文本格式，它更加紧凑、高效。下面是protobuf编码格式的详细解释： 1. Varint编码：Varint是一种可变长度的编码方式，用于对整数...