protobuf是Google开发的一个开源序列化框架,类似XML,JSON,其最大的特点是基于二进制,比传统的XML表示同样一段内容要短小得多。通过protobuf,可以很轻松的调用相关方法来完成业务数据的序列化与反序列化。但是,protobuf在使用当中也发现一些问题,数据在protobuf序列化后无法反序列化,或者丢失部分数据,这就与protobuf的目的违背。下面我们来看下这个问题吧。
首先定义一个protobuf结构,如下:
message Person {
required int32 mid = 1;
required int32 type = 2;
}
再来看下这段代码,看似没有问题:
Person psn0;
psn0.set_mid(1);
psn0.set_type(0);
string str0;
psn0.SerializeToString(&str0);
// 由于网络传输, string 需要转换成 char*
const char* buf = str0.c_str();
// 如果是这样解析,将会引起bug
string str1 = buf;
People psn1;
bool ret1 = psn1.ParseFromString(str1);
if (ret1)
{
cout << "str1 parse success" << endl;
}
else
{
cout << "str1 parse fail" << endl;
}
// 这样解析不会引起bug
string str2;
str2.assign(buf, str0.length());
People psn2;
bool ret2 = psn2.ParseFromString(str2);
if (ret2)
{
cout << "str2 parse success" << endl;
}
else
{
cout << "str2 parse fail" << endl;
}
运行结果,如下:
str1 parse fail
str2 parse success
这里解释一下原因:在以上例子中,protobuf 序列化的 string 数据里含有 '\0' 字符。如果以 char* 取protobuf序列化后的数据,将会丢失部分数据。
虽然这个严格意义来讲也不算protobuf的bug,但在protobuf的使用中一般很少人注意protobuf 的数据中带有'\0' 字符,这就导致了bug的发生。参考:
http://blog.csdn.net/mycwq/article/details/19619875