用过protobuf的人都知道, protobuf的序列化过程是:
协议文件(.proto) + 原始数据 ====》 buffer
反序列化的过程是:
buffer + 协议文件(.proto) ===>原始数据
那有没有办法实现: buffer ===》原始数据 呢? 这是一个貌似无解的问题, 其实有解。
如果在无协议的情况下, 能实现buffer到原始数据的转化, 那就具有非常重要的意义: 抓包后(抓16进制), 可直接转换成原始数据!!! Oh, my god, 效率呈现指数级提升!!! 着实让人兴奋
之前我学过h.264视频压缩, 原始的yuv数据经过h.264压缩后, 生成压缩视频, 每个字节都有其固定含义, 因此可解码。 类似地, 在protobuf序列化过程中, 也有这样的道理。 序列化后的每个字节都有固定含义, 那么自然就可以对这些有固定意义的字节进行解码, 我们来看看代码:
test.proto内容:
package NS;
message PointReq
{
required int32 x=1;
required int32 y=2;
}
taoge@localhost Desktop>
main.cpp内容:
#include <iostream>
#include <string>
using namespace std;
#include "test.pb.h"
using namespace NS;
// 16进制
string bufToHexStr(const char *pBuf, int bufLen)
{
if(NULL == pBuf || bufLen < 0)
{
return "";
}
int i = 0;
string sRet = "";
for(i = 0; i < bufLen; i++)
{
char szTmp[3] = {0};
snprintf(szTmp, sizeof(szTmp), "%02x", (unsigned char)pBuf[i]);
sRet += szTmp;
}
return sRet;
}
int main()
{
PointReq point;
point.set_x(10);
point.set_y(20);
string tmp;
bool ret = point.SerializeToString(&tmp); // 这里要传地址
if (ret)
{
printf("encode ok!\n");
}
else
{
printf("encode error!\n");
return -1;
}
cout << bufToHexStr(tmp.c_str(), tmp.size()) << endl;
PointReq point2;
ret = point2.ParseFromString(tmp);
if (ret)
{
printf("decode ok, %d, %d\n", point2.x(), point2.y());
}
else
{
printf("decode error!\n");
return -2;
}
return 0;
}
结果:
taoge@localhost Desktop> make
g++ -c -L/usr/local/lib -lprotobuf -o main.o main.cpp
g++ -c -L/usr/local/lib -lprotobuf -o test.pb.o test.pb.cc
g++: -lprotobuf: linker input file unused because linking not done
g++: -lprotobuf: linker input file unused because linking not done
g++ -L/usr/local/lib -lprotobuf -o main main.o test.pb.o
taoge@localhost Desktop> ./main
encode ok!
080a1014
decode ok, 10, 20
上面反序列化依赖于test.proto协议文件。
下面, 我们不依赖于test.proto协议文件(仅仅利用序列化的结果080a1014)来反序列化一下:
如果协议是嵌套的, 那么此处的展示结果也是嵌套的, 有缩进关系, 非常好看, 爽心悦目
这个无协议序反序列化工具是某哥开发的, 所以我就不贴源码了。 无协议反序列化真的很有创意我们工作中, 每个人每天都有多次使用。
当然, 在你的公司, 很可能不用protobuf, 而是用自己公司开发的序列化协议框架, 那也一样, 无协议时可反序列化。有兴趣的朋友可以试着写一下无协议时的反序列化代码(一个字节一个字节地抠), 代码量其实很少!