Dubbo 集群容错

Dubbo 集群容错

假设我们运营一个大型的电子商务网站,它有大量的用户在任何时间都在进行购物、浏览商品、添加到购物车、结账等操作。为了处理这种高流量和高并发性的情况,我们可能已经设置了一个由多个服务器组成的计算机集群。

在这种情况下,集群容错就显得非常重要。

集群容错是一种技术,其目的是在集群中的一个或多个节点发生故障时,保证系统整体的持续运行。这是通过故障检测、备份和恢复机制来实现的。

现在,让我们看看在电商网站这个场景中,如何具体应用集群容错。

  1. 故障检测:集群中的每个节点都会定期向其他节点发送“心跳”信号,以表示它们正在正常运行。如果一个节点停止发送心跳,那么其他节点会认为它已经发生故障。
  2. 备份和恢复:集群中的数据通常会在多个节点上进行备份。这样,即使一个节点发生故障,数据也不会丢失。同时,一旦检测到一个节点发生故障,其他节点可以立即接管它的任务,保证用户不会感知到服务中断。

例如,假设一个用户正在结账购物车中的商品,而负责处理这个请求的服务器突然发生故障。由于集群容错的存在,这个请求可以立即被另一个服务器接管,用户可能只会感到稍微的延迟,但不会出现购物失败的情况。

通过以上的方式,集群容错确保了我们的电子商务网站在面对单个或多个服务器故障时,仍能提供稳定、连续的服务给用户,这对于保证用户体验和商业收入来说是至关重要的。

Dubbo 提供了完整的微服务治理方案,包括之前文章提到的注册中心、负载均衡,和今天分享的集群容错等。

集群容错是 Dubbo 中非常重要的组件之一,它能够保证当某个服务节点发生故障或者网络出现问题时,Dubbo 能够自动切换到健康的节点,保证服务稳定

1、FailOver Cluster

Failover Cluster 是 Dubbo 的一种默认集群容错策略,它会在服务提供者节点出现错误时,自动切换到另一个可用节点上。当某个节点发生故障时,Dubbo会自动尝试向其他节点发起请求,直到找到一个可用的节点为止。如果所有的节点均不可用,Dubbo将会抛出异常,告知消费者该服务不可用。

Failover Cluster 有两种启动机制:

1、在消费者端配置 Failover Cluster ,当消费者需要调用服务时,Dubbo 会自动调用 Failover Cluster,来保证服务的可用性和稳定性。

2、在注册中心配置 Failover Cluster ,这种方式一般用于服务端,当服务端节点发生故障时,Dubbo 会通过注册中心通知消费者端,让消费者端自动切换到另一个可用节点上。

2、Failfast Cluster

Failfast Cluster 是 Dubbo 的一种快速失败集群容错策略

当服务提供者节点发生异常时,Dubbo会立即抛出异常,告知消费者该服务不可用。

这种集群容错机制虽然迅速,但是它容易造成雪崩效应。因此,在真正的生产环境中,不建议采用 Failfast Cluster。

3、Failsafe Cluster

Failsafe Cluster 是 Dubbo 的一种安全失败集群容错策略

当服务提供者节点发生异常时,Failsafe Cluster 会忽略此次调用,不会立即抛出异常。而是会将异常信息存储起来,等待下一次调用时,重新尝试调用,直到调用成功或者超时为止。

4、Failback Cluster

Failback Cluster 是 Dubbo 的一种自动恢复集群容错策略

当服务提供者节点发生异常时,Failback Cluster 会自动把请求缓存下来,直到节点恢复正常后,再重新发起请求。

这种集群容错机制虽然比较稳定,但是它需要占用一定的内存,因此在大规模的应用中,建议使用 Failover Cluster。

5、选择

Failover Cluster

失败自动切换,当出现失败,重试其它服务器。通常用于读操作,但重试会带来更长延迟。可通过 retries="2" 来设置重试次数(不含第一次)。

Failfast Cluster

快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。

Failsafe Cluster

失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。

Failback Cluster

失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。

Forking Cluster

并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过 forks="2" 来设置最大并行数。

Broadcast Cluster

广播调用所有提供者,逐个调用,任意一台报错则报错。通常用于通知所有提供者更新缓存或日志等本地资源信息。

现在广播调用中,可以通过 broadcast.fail.percent 配置节点调用失败的比例,当达到这个比例后,BroadcastClusterInvoker 将不再调用其他节点,直接抛出异常。 broadcast.fail.percent 取值在 0~100 范围内。默认情况下当全部调用失败后,才会抛出异常。 broadcast.fail.percent 只是控制的当失败后是否继续调用其他节点,并不改变结果(任意一台报错则报错)。broadcast.fail.percent 参数 在 dubbo2.7.10 及以上版本生效。

Broadcast Cluster 配置 broadcast.fail.percent。

broadcast.fail.percent=20 代表了当 20% 的节点调用失败就抛出异常,不再调用其他节点。

@reference(cluster = "broadcast", parameters = {"broadcast.fail.percent", "20"})

Available Cluster

调用目前可用的实例(只调用一个),如果当前没有可用的实例,则抛出异常。通常用于不需要负载均衡的场景。

Mergeable Cluster

将集群中的调用结果聚合起来返回结果,通常和group一起配合使用。通过分组对结果进行聚合并返回聚合后的结果,比如菜单服务,用group区分同一接口的多种实现,现在消费方需从每种group中调用一次并返回结果,对结果进行合并之后返回,这样就可以实现聚合菜单项。

ZoneAware Cluster

多注册中心订阅的场景,注册中心集群间的负载均衡。对于多注册中心间的选址策略有如下四种

  1. 指定优先级:preferred="true"注册中心的地址将被优先选择
<dubbo:registry address="zookeeper://127.0.0.1:2181" preferred="true" />
  1. 同中心优先:检查当前请求所属的区域,优先选择具有相同区域的注册中心
<dubbo:registry address="zookeeper://127.0.0.1:2181" zone="beijing" />
  1. 权重轮询:根据每个注册中心的权重分配流量
<dubbo:registry id="beijing" address="zookeeper://127.0.0.1:2181" weight="100" />

<dubbo:registry id="shanghai" address="zookeeper://127.0.0.1:2182" weight="10" />
  1. 缺省值:选择一个可用的注册中心

集群模式示例

按照以下示例在服务提供方和消费方配置集群模式

<dubbo:service cluster="failsafe" />

<dubbo:reference cluster="failsafe" />
  • 12
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值