dubbo是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案。
架构
参考:https://github.com/Snailclimb/JavaGuide/blob/master/docs/system-design/data-communication/dubbo.md
上述节点简单说明:
- Provider: 暴露服务的服务提供方
- Consumer: 调用远程服务的服务消费方
- Registry: 服务注册与发现的注册中心
- Monitor: 统计服务的调用次数和调用时间的监控中心
- Container: 服务运行容器
调用关系说明:
- 服务容器负责启动,加载,运行服务提供者。
- 服务提供者在启动时,向注册中心注册自己提供的服务。
- 服务消费者在启动时,向注册中心订阅自己所需的服务。
- 注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。
- 服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。
- 服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心。
重要知识点总结:
- 注册中心负责服务地址的注册与查找,相当于目录服务,服务提供者和消费者只在启动时与注册中心交互,注册中心不转发请求,压力较小
- 监控中心负责统计各服务调用次数,调用时间等,统计先在内存汇总后每分钟一次发送到监控中心服务器,并以报表展示
- 注册中心,服务提供者,服务消费者三者之间均为长连接,监控中心除外
- 注册中心通过长连接感知服务提供者的存在,服务提供者宕机,注册中心将立即推送事件通知消费者
- 注册中心和监控中心全部宕机,不影响已运行的提供者和消费者,消费者在本地缓存了提供者列表
- 注册中心和监控中心都是可选的,服务消费者可以直连服务提供者
- 服务提供者无状态,任意一台宕掉后,不影响使用
- 服务提供者全部宕掉后,服务消费者应用将无法使用,并无限次重连等待服务提供者恢复
负载均衡
一共有4种负载均衡策略:
- RandomLoadBalance 随机调用负载均衡;
- RoundRobinLoadBlance 轮询调用;
- LeastActiveLoadBlance 最少活跃数调用法,使慢的提供者收到更少请求;
- ConsistentHashLoadBalance 一致性Hash算法,相同参数的请求总是发到同一提供者;
dubbo默认的负载均默认是随机调用法。
配置方式:可以在服务级别配置,也可以在方法级别配置。分为xml 配置方式和注解方式。
xml 配置方式
服务级别
provider端:
<dubbo:service interface="..." loadbalance="roundrobin" />
consumer端:
<dubbo:reference interface="..." loadbalance="roundrobin" />
方法级别
provider端
<dubbo:service interface="...">
<dubbo:method name="..." loadbalance="roundrobin"/>
</dubbo:service>
consumer端
<dubbo:reference interface="...">
<dubbo:method name="..." loadbalance="roundrobin"/>
</dubbo:reference>
也可以使用注解的方式进行配置。
@Service
public class OrderServiceImpl implements OrderService {
//@Autowired
@Reference(loadbalance="roundrobin")
UserService userService;
集群容错
参考:https://blog.csdn.net/zhengzhaoyang122/article/details/80884535
集群容错的场景:通信链路故障,指消费者和服务提供者之间的链路(通常为长连接)中断;服务端超时,当服务端无法在指定时间内应答给客户端;超时、流控、解码失败等系统异常造成的服务端调用失败。
消费者根据配置的路由策略选择某个目标地址之后,发起远程服务调用,在此期间如果发生远程服务调用异常,则需要框架进行集群容错,重新进行选路和调用,集群容错是系统自动执行的,上层用户并不关心底层的服务调用过程。
dubbo容错机制的种类
1、Failover:失败自动切换,当出现失败,重试其它服务器 。
应用场景进行总结:
1)、读操作,因为通常它是幂等的。
2)、幂等性服务,保证调用1次与N次效果相同。
因为重试会带来更长延迟。可通过 retries="2" 来设置重试次数(不含第一次)。
集群配置如下:
<dubbo:service cluster="failover" retries="3"/>或<dubbo:reference cluster="failover" retries="3"/>
2、Failfast:快速失败,只发起一次调用,失败立即报错。
通常用于写入审计日志等操作。
<dubbo:service cluster="failsafe" />或<dubbo:reference cluster="failsafe" />
3、Failsafe:失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。
<dubbo:service cluster="failsafe" />或<dubbo:reference cluster="failsafe" />
4、Failback:失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。
<dubbo:service cluster="failback" />或<dubbo:reference cluster="failback" />
5、Forking:并发处理。并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过forks="2"来设置最大并行数。
<dubbo:service cluster="forking" forks="2"/>或<dubbo:reference cluster="forking" forks="2"/>
6、Broadcast: 广播调用所有提供者,逐个调用,任意一台报错则报错。(2.1.0开始支持)。通常用于通知所有提供者更新缓存或日志等本地资源信息。
<dubbo:service cluster="broadcast" />或<dubbo:reference cluster="broadcast" />
Dubbo直连
参考:https://segmentfault.com/a/1190000019896723#item-6
在实际生产中,假如zookeeper注册中心宕掉,一段时间内服务消费方还是能够调用提供方的服务的,实际上它使用的本地缓存进行通讯,这只是dubbo健壮性的一种体现。
dubbo的健壮性表现:
- 监控中心宕掉不影响使用,只是丢失部分采样数据
- 数据库宕掉后,注册中心仍能通过缓存提供服务列表查询,但不能注册新服务
- 注册中心对等集群,任意一台宕掉后,将自动切换到另一台
- 注册中心全部宕掉后,服务提供者和服务消费者仍能通过本地缓存通讯
- 服务提供者无状态,任意一台宕掉后,不影响使用
- 服务提供者全部宕掉后,服务消费者应用将无法使用,并无限次重连等待服务提供者恢复
我们前面提到过:注册中心负责服务地址的注册与查找,相当于目录服务,服务提供者和消费者只在启动时与注册中心交互,注册中心不转发请求,压力较小。所以,我们可以完全可以绕过注册中心——采用 dubbo 直连 ,即在服务消费方配置服务提供方的位置信息。
<dubbo:reference id="userService" interface="com.zang.gmall.service.UserService" url="dubbo://localhost:20880" />
可以看到,只要在消费端在 dubbo:reference
节点使用 url
给出服务端的方法即可。
服务熔断
参考:https://www.jianshu.com/p/098dd5876381
由于网络原因或者自身的原因,服务并不能保证100%的可用,如果单个服务出现问题,调用这个服务就会出现线程阻塞,此时若有大量的请求涌入,servlet容器的线程资源就会消耗完毕,导致服务瘫痪。服务之间与服务之间的依赖性,故障会传播,会对整个微服务系统造成灾难性的严重的后果,这就是服务故障的“雪崩”效应。
如果我们检查出来某个请求频繁的超时,就把consumer调用provider的请求直接短路掉,不实际调用,而是直接返回一个mock的值。等provider服务恢复稳定之后,重新调用。
Netflix 开源了 Hystrix 组件,实现了熔断器模式,Spring Cloud 对这一组件进行了整合。
服务降级
当服务器压力剧增的情况下,根据实际业务情况以及流量,对一些服务和页面有策略的不处理或者换种简单的方式处理,从而释放服务器资源以保证核心交易正常运转或高效运作。
可以通过服务降级功能临时屏蔽某个出错的非关键服务,并定义降级后的返回策略。
限流
参考:https://blog.csdn.net/u012965203/article/details/98253914
为了防止某个消费者的QPS或是所有消费者的QPS的总和突然飙升而导致的重要服务的失效,系统可以对访问流量进行控制,这种对集群的保护措施称为服务限流。
Dubbo中能够实现服务限流的方式可以划分为两类:直接限流与间接限流。
中文文档:http://dubbo.apache.org/zh-cn/docs/user/quick-start.html