一、是什么
Dubbo是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案。
根据定义可知,dubbo主要两个功能。一是远程调用,二是服务治理。服务治理,就是随着业务的复杂,系统之间的调用越来越混乱。因此才有必要服务治理。
二、核心
dubbo主要包括三大核心:
1、远程通讯:提供对多种基于长连接的NIO框架抽象封装,包括多种线程模型,序列化(默认Hessian),以及“请求-响应”模式的信息交换方式。
2、集群容错:提供基于接口方法的透明远程过程调用,包括多协议支持(默认dubbo ),以及软负载均衡(默认Random LoadBalance),失败容错(默认Failover Cluster),地址路由,动态配置等集群支持。
3、自动发现:基于注册中心目录服务,使服务消费方能动态的查找服务提供方,使地址透明,使服务提供方可以平滑增加或减少机器。
三、能做什么:
1、透明化的远程方法调用,就像调用本地方法一样调用远程方法,只需简单配置,没有任何API侵入。
2、软负载均衡及容错机制,可在内网替代F5等硬件负载均衡器,降低成本,减少单点故障。
3、服务自动注册与发现,不再需要写死服务提供方地址,注册中心基于接口名查询服务提供者的IP地址,并且能够平滑添加或删除服务提供者。
四、需求:
在大规模服务化之前,应用可能只是通过RMI或Hessian等工具,简单的暴露和引用远程服务,通过配置服务的URL地址进行调用,通过F5等硬件进行负载均衡。
当服务越来越多时,服务URL配置管理变得非常困难,F5硬件负载均衡器的单点压力也越来越大。此时需要一个服务注册中心,动态注册和发现服务,使服务的位置透明。在消费方获取提供方地址列表,实现软负载均衡和Failover(失效备援),降低对F5等硬件负载均衡器的依赖。
当进一步发展,服务间依赖关系变得错综复杂,甚至分不清哪个应用要在哪个应用之前启动,架构师都不能完整的描述应用的架构关系。
接着,服务的调用量越来越大,服务的容量问题就暴露出来,这个服务需要多少机器支持?什么时候该加机器?为了解决这些问题,首先,要将服务现在每天的调用量、响应时间,都统计出来,作为容量规范的参考标准。其次,要可以动态调整权重,在线上,将某台机器的权重一直加大,并在加大的过程中记录响应时间的变化,知道响应时间到达阈值,记录此时的访问量,再以此访问量乘以机器数反推总容量。
五、架构:
调用关系说明:
1、服务容器(Container)负责启动,加载,运行服务提供者。
2、服务提供者(Provider)启动,向注册中心注册自己提供的服务。
3、服务消费者(Consumer)启动,向注册中心订阅自己所需的服务。
4、注册中心(Registry)把服务提供者地址列表返回给消费者。
5、服务消费者(Consumer),从提供者地址列表中,基于软负载均衡算法,选一台提供者进行进行调用,如果调用失败,再选另一台调用。
6、监控中心(Monitor)定时每分钟收集统计数据(消费者和提供者之间的调用次数、调用时间)
六、原理:
dubbo一共分为10层。这10层的由来,可以参考上面的架构图。以及最下面的原理图
七、负载均衡策略
1、random loadbalance(随机)
按权重来设置随机概率。
2、roundrobin loadbalance(轮训)
轮训就是轮着来。先是服务器1、然后服务器2、然后服务器3,再后服务器1。
3、 LeastActive LoadBalance(最少活跃调用数)
这个就是自动感知一下,比如某台机器性能较差,那么接收的请求越少越不活跃。此时就会给不活跃的性能差的机器更少的请求。
4、ConsistentHash LoadBalance(一致性Hash)
某个订单id对应的请求,必须分发到固定一台机器上。