《分布式服务框架原理与实践》
一、RPC架构
rpc,全称remote procedure call,即远程过程调用。它是一种进程间的通信方式,允许像调用本地服务一样,调用远程的服务。有很多的具体实现,如spring的http invoker、facebook的thrift二进制私有协议通信。
rpc在80s,由bruce jay nelson提出,他在论文中做了如下定义:
1)简单:rpc概念的语义十分清晰以及简单,这样建立分布式计算就更容易。
2)高效:过程调用看起来十分简单,而且高效。
3)通用:在单机计算中往往是算法和api,跨进程最重要的是通用的通信机制。
2006年后,随着互联网移动的发展以及智能终端的普及,远程分布式调用已经成为主流,开源和自研的rpc框架的普及标志
着传统垂直应用架构的终结。
二、原理
rpc框架的目标是让远程过程(服务),调用更加简单透明,rpc负责屏蔽底层传输方式(tcp udp)、序列化方式(xml json 二进制)以及通信细节。框架的使用者,只需要了解谁在什么位置,提供了什么样的远程服务即可,开发者不用关系底层的调用过程和通信细节。
框架原理图:
核心技术点:
1)远程服务提供者需要以某种形式提供 服务调用 的相关信息,包括但不限于接口定义、数据结构、或者中间态的服务定义文件,例如thrift的IDL文件,WS-RPC的WSDL文件定义,甚至也可以是服务端接口的说明文档。服务调用者需要通过一定的途径获取远程服务的调用的相关信息,例如服务端接口定义jar包导入,获取服务端IDL文件等。
2)远程代理对象:服务调用者调用的服务实际上是远程服务的本地代理,对于java语言,它的实现就是jdk动态代理,通过动态代理的拦截机制,将本地调用封装成远程服务调用。
3)通信:rpc与具体的协议无关,例如spring远程调用支持http invoker、rmi invoke,MessagePack使用的是私有的二进制压缩协议。
4)序列化:远程通信,需要将对象转换成二进制码流进行传输,不同的框架支持的数据类型,数据包大小,异常类型,以及性能都不同,不同的rpc框架应用场景不同,因此技术选择会存在很大差异,一些比较好的rpc框架,支持多种序列化方式,甚至支持用户自定义序列化框架(hadoop avro)。
三、简单实现一个rpc框架
分析:
分为三个部分:
1)服务提供者:运行在服务端,负责提供接口的定义以及服务具体实现类
2)服务发布者:运行在rpc服务端,负责将本地服务发布成远程服务,供消费者使用
主要职责:作为服务端,监听客户端的socket连接,接收到新的连接后,将其封装成task,由线程池执行;