前言
大家好,今天开始给大家分享 — Dubbo 专题之 Dubbo 序列化。在前一个章节中我们介绍了 Dubbo 路由规则之标签路由,其实现原理为:如果消费端传递标签则和配置的动态规则和静态规则进行匹配,如果消费端未传递标签则使用服务提供端的本地配置的静态标签和动态配置标签进行匹配。同时我们也例举了常见的使用场景并且进行了源码解析来分析其实现原理。有的小伙伴可以想知道 Dubbo 中远程调用数据传输是通过哪些方式进行数据的序列化呢?那么这个章节我们一起来讨论在我们的 Dubbo 中有哪些序列化方式以及性能表现如何。下面就让我们快速开始吧!
1. 序列化简介
首先我们得明白什么是序列化和反序列化,举个简单的例子:当我们需要把一个数据对象写入到文件或者在网络中传输时,就要把数据对象进行转换为二进制格式进行数据传输这个过程就叫做序列化,反之如果一个远程数据或本地文件数据需要读取并解析为我们的对象时就叫做反序列化。在 Dubbo RPC 中,同时支持多种序列化方式:
-
Dubbo 序列化:阿里尚未开发成熟的高效 Java 序列化实现,阿里不建议在生产环境使用它
-
Hessian2 序列化:Hessian 是一种跨语言的高效二进制序列化方式。但这里实际不是原生的 Hessian2 序列化,而是阿里修改过的Hessian Lite,它是 Dubbo RPC 默认启用的序列化方式
-
Json 序列化:目前有两种实现,一种是采用的阿里的 Fastjson 库,另一种是采用 Dubbo中自己实现的简单 Json库,但其实现都不是特别成熟,而且 Json 这种文本序列化性能一般不如上面两种二进制序列化。
-
Java 序列化:主要是采用 JDK 自带的 Java 序列化实现,性能很不理想。
下图是当前2.7.x版本中支持的序列化方式:
Dubbo RPC 默认采用 Hessian2 序列化。但 Hessian 是一个比较老的序列化实现了,而且它是跨语言的,所以不是单独针对 Java 进行优化的。而 Dubbo RPC实际上完全是一种 Java to Java 的远程调用,其实没有必要采用跨语言的序列化方式。最近几年,各种新的高效序列化方式层出不穷,不断刷新序列化性能的上限,最典型的包括:
-
专门针对Java语言的:Kryo、FST等等
-
跨语言的:Protostuff、ProtoBuf、Thrift、Avro、MsgPack等等
其中,Kryo 是一种非常成熟的序列化实现,已经在Twitter、Groupon、Yahoo以及多个著名开源项目(如Hive、Storm)中广泛的使用。而FST是一种较新的序列化实现,目前还缺乏足够多的成熟使用案例。
2. 配置方式
下面我们主要通过 XML 方式进行配置介绍:
XML 方式
<dubbo:protocol name="dubbo" serialization="hession2"/>
这里使用serialization
来进行序列化方式配置。
3. 使用场景
根据前面的介绍我们大概理解了什么是序列化和反序列化,而序列化和反序列化在 Dubbo 中是必须的,那么 Dubbo 中提供了多种序列化方式我们应该使用哪一种序列化方式呢?我们先看一个来自官网的性能测试图:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LFQBI7oR-162