https://zhuanlan.zhihu.com/p/91313277
为什么需要序列化和反序列化协议
name: 姓名, 比如darren
age: 年龄,比如80
languages: 熟悉的编程语言, 普通数组方式,比如["C++", "Linux"],
phone: 电话号码,是嵌套的对象,包含number和type, 比如"number": "18570368134",
"type": "home
books: 对象数组方式,可以包含多本书信息, 每本书包含name和price属性。
vip: 是否为vip, 比如true
address: 地址, 比如"yageguoji"
我们要传输这样一个对象,里面的变量有些是数组形式(languages),有些又还是对象(phone),有些还是数组对象(books)。
此时我们要将对象从客户端传输到服务器,那应该怎么传输,定义一个person对象,在描述完起成员变量将这个对象占用的内存发送给服务器?比如:
//简单伪代码
Person p1;
封装p1;
然后send(&p1, sizeof(p1).)
这样子行不行?
答案是:肯定不行了。比如 languages可能是"C",也可能是是"C++","Linux",此时我们sizeof(p1)是固定还是不固定?假如不固定那服务器怎么解析出一个Person来?大家可以自己再仔细的分析。
既然不能直接传对象,那怎么办?这时候序列化协议就发挥作用了。
序列化和反序列化基础
序列化和反序列化概念
- 序列化:把对象转换为字节序列的过程称为对象的序列化。
- 反序列化:把字节序列恢复为对象的过程称为对象的反序列化。
什么情况下需要序列化
- 当你想把的内存中的对象状态保存到一个文件中或者数据库中时候;
- 当你想用套接字在网络上传送对象的时候。
如何实现序列化?
主流序列化协议:xml、json、protobuf
xml/json/protobuf对比
xml序列化结果
json序列化结果
protobuf序列化结果
xml/json/protobuf简介
XML 指可扩展标记语言(eXtensible Markup Language)。是一种通用和重量级的数据交换格式。以文本结构存储。
JSON(JavaScript Object Notation, JS 对象简谱) 是一种通用和轻量级的数据交换格式。以文本结构存储。
protocol buffer是Google的一种独立和轻量级的数据交换格式。以二进制结构进行存储。
名词解释:
- 通用:协议是标准的,不同的第三方软件都可以相互进行序列化和反序列化,比如使用cjson序列化后的数据,可以使用jsoncpp反序列化。
- 独立:标准是私有的,比如protocol buffer协议,目前只有Google自家支持。
- 文本格式:可以看出内容的具体文字含义,比如
- 二进制格式:纯数值的数据,可读性不强。比如protobuf序列化后的数据。
速度测试和序列化后数据大小对比
测试10万次序列化
测试10万次反序列化
带宽计算对比
以腾讯云带宽成本进行核算
以QPS 1万计算
提一个问题,如何在工程中使用protobuf?
- proto文件命名风格;
- package和命名空间的关系;
- proto文件的引用;
- 服务器端如果识别不同的protobuf对象。