全方位评测：Protobuf性能到底有没有比JSON快5倍？

最新推荐文章于 2025-04-13 08:51:49 发布

demystify

最新推荐文章于 2025-04-13 08:51:49 发布

阅读量3.7w

点赞数 16

分类专栏： Java

Java 专栏收录该内容

70 篇文章

订阅专栏

转自：http://www.52im.net/thread-772-1-1.html

原文：http://www.infoq.com/cn/articles/json-is-5-times-faster-than-protobuf

1、前言

拿 JSON 衬托 Protobuf 的文章真的太多了，经常可以看到文章中写道：“快来用 Protobuf 吧，JSON 太慢啦”。但是 Protobuf 真的有吹的那么牛么？我觉得从 JSON 切换到 Protobuf 怎么也得快一倍吧，要不然对不起付出的切换成本。然而，DSL-JSON 的家伙们居然说在Java语言里 JSON 和那些二进制的编解码格式有得一拼（https://blog.dsl-platform.com/improving-java-json-speed/ ），这太让人惊讶了！虽然你可能会说，咱们能不用苹果和梨来做比较了么？两个东西根本用途完全不一样好么。咱们用 Protobuf 是冲着跨语言无歧义的 IDL 的去的，才不仅仅是因为性能呢。好吧，这个我同意。但是仍然有那么多人盲目相信，Protobuf 一定会快很多，我觉得还是有必要彻底终结一下这个关于速度的传说。

DSL-JSON 的博客里只给了他们的测试结论，但是没有给出任何原因，以及优化的细节。这很难让人信服数据是真实的。你要说 JSON 比二进制格式更快，真的是很反直觉的事情。

稍微琢磨一下这个问题，就可以列出好几个 Protobuf 应该更快的理由：

更容容易绑定值到对象的字段上。JSON 的字段是用字符串指定的，相比之下字符串比对应该比基于数字的字段tag更耗时。
JSON 是文本的格式，整数和浮点数应该更占空间而且更费时。
Protobuf 在正文前有一个大小或者长度的标记，而 JSON 必须全文扫描无法跳过不需要的字段。

但是仅凭这几点是不是就可以盖棺定论了呢？未必，也有相反的观点：

如果字段大部分是字符串，占到决定性因素的因素可能是字符串拷贝的速度，而不是解析的速度。在这个评测中（https://github.com/fabienrenaud/java-json-benchmark ），我们看到不少库的性能是非常接近的。这是因为测试数据中大部分是由字符串构成的。
影响解析速度的决定性因素是分支的数量。因为分支的存在，解析仍然是一个本质上串行的过程。虽然Protobuf里没有[] 或者 {}，但是仍然有类似的分支代码的存在。如果没有这些分支的存在，解析不过就是一个 memcpy 的操作而已。只有 Parabix 这样的技术才有革命性的意义，而 Protobuf 相比 JSON 只是改良而非革命。
也许 Protobuf 是一个理论上更快的格式，但是实现它的库并不一定就更快。这取决于优化做得好不好，如果有不必要的内存分配或者重复读取，实际的速度未必就快。

有多个 benchmark 都把 DSL-JSON列到前三名里，有时甚至比其他的二进制编码更快。经过我仔细分析，原因出在了这些 benchmark 对于测试数据的构成选择上。因为构造测试数据很麻烦，所以一般评测只会对相同的测试数据，去测不同的库的实现。这样就使得结果是严重倾向于某种类型输入的。比如 https://github.com/eishay/jvm-serializers/wiki 选择的测试数据的结构是这样的：

message Image {

required string uri = 1; //url to the thumbnail

optional string title = 2; //used in the html ALT

required int32 width = 3; // of the image

required int32 height = 4; // of the image

enum Size {

SMALL = 0;

LARGE = 1;

}

required Size size = 5; // of the image (in relative terms, provided by cnbc for example)

}

message Media {

required string uri = 1; //uri to the video, may not be an actual URL

optional string title = 2; //used in the html ALT

required int32 width = 3; // of the video

required int32 height = 4; // of the video

required string format = 5; //avi, jpg, youtube, cnbc, audio/mpeg formats ...

required int64 duration = 6; //time in miliseconds

required int64 size = 7; //file size

optional int32 bitrate = 8; //video

repeated string person = 9; //name of a person featured in the video

enum Player {

JAVA = 0;

FLASH = 1;

}

required Player player = 10; //in case of a player specific media

optional string copyright = 11;//media copyright

}

message MediaContent {

repeated Image image = 1;

required Media media = 2;

}

无论怎么去构造 small/medium/large 的输入，benchmark 仍然是存在特定倾向性的。而且这种倾向性是不明确的。比如 medium 的输入，到底说明了什么？medium 对于不同的人来说，可能意味着完全不同的东西。所以，在这里我想改变一下游戏的规则。不去选择一个所谓的最现实的配比，而是构造一些极端的情况。这样，我们可以一目了然的知道，JSON的强项和弱点都是什么。通过把这些缺陷放大出来，我们也就可以对最坏的情况有一个清晰的预期。具体在你的场景下性能差距是怎样的一个区间内，也可以大概预估出来。

3、本次评测对象

好了，废话不多说了。JMH 撸起来。benchmark 的对象有以下几个：

Jackson：Java 程序里用的最多的 JSON 解析器。benchmark 中开启了 AfterBurner 的加速特性；
DSL-JSON：世界上最快的 Java JSON 实现；
Jsoniter：我抄袭 DSL-JSON 写的实现。特别申明：我是 Jsoniter 的作者。这里提到的所有关于Jsoniter 的评测数据都不应该被盲目相信。大部分的性能优化技巧是从 DSL-JSON 中直接抄来的；
Fastjson：在中国很流行的 JSON 解析器；
Protobuf：在 RPC （远程方法调用）里非常流行的二进制编解码格式；
Thrift：另外一个很流行的 RPC 编解码格式。这里 benchmark 的是 TCompactProtocol。

4、整数解码性能测试（Decode Integer）

先从一个简单的场景入手。毫无疑问，Protobuf 非常擅长于处理整数：

message PbTestObject {

int32 field1 = 1;

}

https://github.com/json-iterator/java-benchmark/tree/master/src/main/java/com/jsoniter/benchmark/with_int

全方位评测：Protobuf性能到底有没有比JSON快5倍？_1.jpg
从结果上看，似乎优势非常明显。但是因为只有 1 个整数字段，所以可能整数解析的成本没有占到大头。

所以，我们把测试调整对象调整为 10 个整数字段。再比比看：

syntax = "proto3";

option optimize_for = SPEED;

message PbTestObject {

int32 field1 = 1;

int32 field2 = 2;

int32 field3 = 3;

int32 field4 = 4;

int32 field5 = 5;

int32 field6 = 6;

int32 field7 = 7;

int32 field8 = 8;

int32 field9 = 9;

int32 field10 = 10;

}

https://github.com/json-iterator/java-benchmark/tree/master/src/main/java/com/jsoniter/benchmark/with_10_int_fields

全方位评测：Protobuf性能到底有没有比JSON快5倍？_2.jpg
这下优势就非常明显了。毫无疑问，Protobuf 解析整数的速度是非常快的，能够达到 Jackson 的 8 倍。

DSL-JSON 比 Jackson 快很多，它的优化代码在这里https://github.com/ngs-doo/dsl-json/blob/master/library/src/main/java/com/dslplatform/json/NumberConverter.java

private static int parsePositiveInt(final byte[] buf, final JsonReader reader, final int start, final int end, int i) throws IOException {

int value = 0;

for (; i < end; i++) {

final int ind = buf[i] - 48;

if (ind < 0 || ind > 9) {

... // abbreviated

}

value = (value << 3) + (value << 1) + ind;

if (value < 0) {

throw new IOException("Integer overflow detected at position: " + reader.positionInStream(end - start));

}

return value;

}

整数是直接从输入的字节里计算出来的，公式是 value = (value << 3) + (value << 1) + ind; 相比读出字符串，然后调用 Integer.valueOf ，这个实现只遍历了一遍输入，同时也避免了内存分配。

Jsoniter 在这个基础上做了循环展开：

... // abbreviated

int i = iter.head;

int ind2 = intDigits[iter.buf[i]];

if (ind2 == INVALID_CHAR_FOR_NUMBER) {

iter.head = i;

return ind;

}

int ind3 = intDigits[iter.buf[++i]];

if (ind3 == INVALID_CHAR_FOR_NUMBER) {

iter.head = i;

return ind * 10 + ind2;

}

int ind4 = intDigits[iter.buf[++i]];

if (ind4 == INVALID_CHAR_FOR_NUMBER) {

iter.head = i;

return ind * 100 + ind2 * 10 + ind3;

}

... // abbreviated

5、整数编码性能测试（Encode Integer）

编码方面情况如何呢？和编码一样的测试数据，测试结果如下：

全方位评测：Protobuf性能到底有没有比JSON快5倍？_3.jpg

不知道为啥，Thrift 的序列化特别慢。而且别的 benchmark 里 Thrift 的序列化都是算慢的。我猜测应该是实现里有不够优化的地方吧，格式应该没问题。整数编码方面，Protobuf 是 Jackson 的 3 倍。但是和 DSL-JSON 比起来，好像没有快很多。

这是因为 DSL-JSON 使用了自己的优化方式，和 JDK 的官方实现不一样 https://github.com/ngs-doo/dsl-json/blob/master/library/src/main/java/com/dslplatform/json/NumberConverter.java

private static int serialize(final byte[] buf, int pos, final int value) {

int i;

if (value < 0) {

if (value == Integer.MIN_VALUE) {

for (int x = 0; x < MIN_INT.length; x++) {

buf[pos + x] = MIN_INT[x];

}

return pos + MIN_INT.length;

}

i = -value;

buf[pos++] = MINUS;

} else {

i = value;

}

final int q1 = i / 1000;

if (q1 == 0) {

pos += writeFirstBuf(buf, DIGITS[i], pos);

return pos;

}

final int r1 = i - q1 * 1000;

final int q2 = q1 / 1000;

if (q2 == 0) {

final int v1 = DIGITS[r1];

final int v2 = DIGITS[q1];

int off = writeFirstBuf(buf, v2, pos);

writeBuf(buf, v1, pos + off);

return pos + 3 + off;

}

final int r2 = q1 - q2 * 1000;

final long q3 = q2 / 1000;

final int v1 = DIGITS[r1];

final int v2 = DIGITS[r2];

if (q3 == 0) {

pos += writeFirstBuf(buf, DIGITS[q2], pos);

} else {

final int r3 = (int) (q2 - q3 * 1000);

buf[pos++] = (byte) (q3 + '0');

writeBuf(buf, DIGITS[r3], pos);

pos += 3;

}

writeBuf(buf, v2, pos);

writeBuf(buf, v1, pos + 3);

return pos + 6;

}

这段代码的意思是比较令人费解的。不知道哪里就做了数字到字符串的转换了。过程是这样的，假设输入了19823，会被分解为 19 和 823 两部分。然后有一个 `DIGITS` 的查找表，根据这个表把 19 翻译为 "19"，把 823 翻译为 "823"。其中 "823" 并不是三个byte分开来存的，而是把bit放到了一个integer里，然后在 writeBuf 的时候通过位移把对应的三个byte解开的

private static void writeBuf(final byte[] buf, final int v, int pos) {

buf[pos] = (byte) (v >> 16);

buf[pos + 1] = (byte) (v >> 8);

buf[pos + 2] = (byte) v;

}

这个实现比 JDK 自带的 Integer.toString 更快。因为查找表预先计算好了，节省了运行时的计算成本。

6、双精度浮点数解码性能测试（Decode Double）

解析 JSON 的 Double 就更慢了。

message PbTestObject {

double field1 = 1;

double field2 = 2;

double field3 = 3;

double field4 = 4;

double field5 = 5;

double field6 = 6;

double field7 = 7;

double field8 = 8;

double field9 = 9;

double field10 = 10;

}

https://github.com/json-iterator/java-benchmark/tree/master/src/main/java/com/jsoniter/benchmark/with_10_double_fields

全方位评测：Protobuf性能到底有没有比JSON快5倍？_4.jpg
Protobuf 解析 double 是 Jackson 的 13 倍。毫无疑问，JSON真的不适合存浮点数。

DSL-Json 中对 Double 也是做了特别优化的https://github.com/ngs-doo/dsl-json/blob/master/library/src/main/java/com/dslplatform/json/NumberConverter.java

private static double parsePositiveDouble(final byte[] buf, final JsonReader reader, final int start, final int end, int i) throws IOException {

long value = 0;

byte ch = ' ';

for (; i < end; i++) {

ch = buf[i];

if (ch == '.') break;

final int ind = buf[i] - 48;

value = (value << 3) + (value << 1) + ind;

if (ind < 0 || ind > 9) {

return parseDoubleGeneric(reader.prepareBuffer(start), end - start, reader);

}

if (i == end) return value;

else if (ch == '.') {

i++;

long div = 1;

for (; i < end; i++) {

final int ind = buf[i] - 48;

div = (div << 3) + (div << 1);

value = (value << 3) + (value << 1) + ind;

if (ind < 0 || ind > 9) {

return parseDoubleGeneric(reader.prepareBuffer(start), end - start, reader);

}

return value / (double) div;

}

return value;

}

浮点数被去掉了点，存成了 long 类型，然后再除以对应的10的倍数。如果输入是3.1415，则会变成 31415/10000。

7、双精度浮点数编码性能测试（Encode Double）

把 double 编码为文本格式就更困难了。

全方位评测：Protobuf性能到底有没有比JSON快5倍？_5.jpg
解码 double 的时候，Protobuf 是 Jackson 的13 倍。如果你愿意牺牲精度的话，Jsoniter 可以选择只保留6位小数。在这个取舍下，可以好一些，但是 Protobuf 仍然是Jsoniter 的两倍。

保留6位小数的代码是这样写的。把 double 的处理变成了长整数的处理。

if (val < 0) {

val = -val;

stream.write('-');

}

if (val > 0x4ffffff) {

stream.writeRaw(Double.toString(val));

return;

}

int precision = 6;

int exp = 1000000; // 6

long lval = (long)(val * exp + 0.5);

stream.writeVal(lval / exp);

long fval = lval % exp;

if (fval == 0) {

return;

}

stream.write('.');

if (stream.buf.length - stream.count < 10) {

stream.flushBuffer();

}

for (int p = precision - 1; p > 0 && fval < POW10[p]; p--) {

stream.buf[stream.count++] = '0';

}

stream.writeVal(fval);

while(stream.buf[stream.count-1] == '0') {

stream.count--;

}

到目前来看，我们可以说 JSON 不是为数字设计的。如果你使用的是 Jackson，切换到 Protobuf 的话可以把数字的处理速度提高 10 倍。然而 DSL-Json 做的优化可以把这个性能差距大幅缩小，解码在 3x ~ 4x 之间，编码在 1.3x ~ 2x 之间（前提是牺牲 double 的编码精度）。

因为 JSON 处理 double 非常慢。所以 Jsoniter 提供了一种把 double 的 IEEE 754 的二进制表示（64个bit）用 base64 编码之后保存的方案。如果希望提高速度，但是又要保持精度，可以使用 Base64FloatSupport.enableEncodersAndDecoders();

long bits = Double.doubleToRawLongBits(number.doubleValue());

Base64.encodeLongBits(bits, stream);

static void encodeLongBits(long bits, JsonStream stream) throws IOException {

int i = (int) bits;

byte b1 = BA[(i >>> 18) & 0x3f];

byte b2 = BA[(i >>> 12) & 0x3f];

byte b3 = BA[(i >>> 6) & 0x3f];

byte b4 = BA[i & 0x3f];

stream.write((byte)'"', b1, b2, b3, b4);

bits = bits >>> 24;

i = (int) bits;

b1 = BA[(i >>> 18) & 0x3f];

b2 = BA[(i >>> 12) & 0x3f];

b3 = BA[(i >>> 6) & 0x3f];

b4 = BA[i & 0x3f];

stream.write(b1, b2, b3, b4);

bits = (bits >>> 24) << 2;

i = (int) bits;

b1 = BA[i >> 12];

b2 = BA[(i >>> 6) & 0x3f];

b3 = BA[i & 0x3f];

stream.write(b1, b2, b3, (byte)'"');

}

对于 0.123456789 就变成了 "OWNfmt03P78"

8、对象解码性能测试（Decode Object）

我们已经看到了 JSON 在处理数字方面的笨拙丑态了。在处理对象绑定方面，是不是也一样不堪？前面的 benchmark 结果那么差和按字段做绑定是不是有关系？毕竟我们有 10 个字段要处理那。这就来看看在处理字段方面的效率问题。

为了让比较起来公平一些，我们使用很短的 ascii 编码的字符串作为字段的值。这样字符串拷贝的成本大家都差不到哪里去。所以性能上要有差距，必然是和按字段绑定值有关系。

message PbTestObject {

string field1 = 1;

}

https://github.com/json-iterator/java-benchmark/tree/master/src/main/java/com/jsoniter/benchmark/with_1_string_field

全方位评测：Protobuf性能到底有没有比JSON快5倍？_7.jpg
如果只有一个字段，Protobuf 是 Jackson 的 2.5 倍。但是比 DSL-JSON 要慢。

我们再把同样的实验重复几次，分别对应 5 个字段，10个字段的情况。

message PbTestObject {

string field1 = 1;

string field2 = 2;

string field3 = 3;

string field4 = 4;

string field5 = 5;

}

https://github.com/json-iterator/java-benchmark/tree/master/src/main/java/com/jsoniter/benchmark/with_5_string_fields

全方位评测：Protobuf性能到底有没有比JSON快5倍？_8.jpg
在有 5 个字段的情况下，Protobuf 仅仅是 Jackson 的 1.3x 倍。如果你认为 JSON 对象绑定很慢，而且会决定 JSON 解析的整体性能。对不起，你错了。

message PbTestObject {

string field1 = 1;

string field2 = 2;

string field3 = 3;

string field4 = 4;

string field5 = 5;

string field6 = 6;

string field7 = 7;

string field8 = 8;

string field9 = 9;

string field10 = 10;

}

https://github.com/json-iterator/java-benchmark/tree/master/src/main/java/com/jsoniter/benchmark/with_10_string_fields

全方位评测：Protobuf性能到底有没有比JSON快5倍？_9.jpg
把字段数量加到了 10 个之后，Protobuf 仅仅是 Jackson 的 1.22 倍了。看到这里，你应该懂了吧。

Protobuf 在处理字段绑定的时候，用的是 switch case：

boolean done = false;

while (!done) {

int tag = input.readTag();

switch (tag) {

case 0:

done = true;

break;

default: {

if (!input.skipField(tag)) {

done = true;

}

break;

}

case 10: {

java.lang.String s = input.readStringRequireUtf8();

field1_ = s;

break;

}

case 18: {

java.lang.String s = input.readStringRequireUtf8();

field2_ = s;

break;

}

case 26: {

java.lang.String s = input.readStringRequireUtf8();

field3_ = s;

break;

}

case 34: {

java.lang.String s = input.readStringRequireUtf8();

field4_ = s;

break;

}

case 42: {

java.lang.String s = input.readStringRequireUtf8();

field5_ = s;

break;

}

这个实现比 Hashmap 来说，仅仅是稍微略快而已。DSL-JSON 的实现是先 hash，然后也是类似的分发的方式：

switch(nameHash) {

case 1212206434:

_field1_ = com.dslplatform.json.StringConverter.deserialize(reader);