熔断机制:预防一个服务故障导致整个系统崩掉

本文探讨了新零售系统中用户服务接口的两个常见问题,一是用户车辆位置接口请求延迟,二是通用权限列表缓存超时引发的连锁故障。通过线程隔离和熔断机制,提出解决思路,包括限制特定接口并发、设置请求阈值及服务降级策略,以提升系统的稳定性。
摘要由CSDN通过智能技术生成

一、引言

一个系统通常包含多个服务,服务之间的数据顺利交互,是整个系统能够正常工作的基本要求。

但实际应用中,不少人会经常遇到某个服务异常工作后,整个系统随之崩掉的情况,这种情况我们应该如何预防和处理呢?本章节的内容希望能够给你带来些启发。


二、场景介绍

2.1 接口简述

一个新零售架构系统中 ,有一个通用用户服务,很多页面都会使用,它包含两个接口。

第一个接口:用户态接口
接口功能:返回用户车辆所在位置。
使用业务:在用户信息展示页面会使用到,比如客服系统中的用户信息页面。
数据来源:对接第三方系统,由第三方返回,然后接口再返回给接口调用者。


第二个接口:用户可操作权限列表
接口功能:返回用户一个可操作的权限列表,包含一个通用权限,也包含用户定制权限。
使用业务:每次用户打开APP时都会使用。
数据来源:从缓存中或者数据库读取。


2.2 接口遇到的问题

第一个接口遇到的问题:请求慢
在这里插入图片描述
服务间的关系调用具体流程分为3个步骤:
1)APP访问User API;
2)UserAPI 访问基础数据服务的接口 /currentCarLocation;
3)基础服务与第三方系统交互,获取数据。

问题:第三方响应速度很慢且有时还会抽风,导致响应时间更长,接口经常出现超时报错。



第二个接口遇到的问题:流量洪峰缓存超时
在这里插入图片描述
服务间的关系调用具体流程分为以下3个步骤:
1)APP方位UserAPI;
2)UserAPI访问基础数据服务的接口 /commonAccess;
3)基础数据服务提供一个通用权限列表。因为权限列表对所有用户都一样,所以我们把数据存放在Redis中,如果通用权限在Redis中找不到 ,我们再去数据库中查找。

问题:

  • 在流量高峰期时Redis的通用权限列表超时了,那一瞬间所有的线程都需要去数据库中读取数据,导致DB中的CPU立马飙到100%。
  • DB 挂后,紧接着 Basic Data Service 也挂了,因所有的线程堵塞了,我们获取不到数据库连接,导致 Basic Data Service 无法接受新的请求。
  • 而 User API 因调用了 Basic Data Service 的线程出现了堵塞,以至于 User API 服务的所有线程也出现堵塞,即 User API 也挂了,导致 App 上的所有操作都不能使用。


三、解决思路

为了解决上述两个问题,需要满足下面两个条件:

(1)线程隔离

针对第一个问题,希望的处理方式是:User API中每个服务配置的最大连接数是1000,每次API调用BasicDataService的/currentCarLocation的速度就会很慢。

因此,希望可以控制/currentCarLocation的调用请求数,保证不超过50条,以此保证至少还有 950 条的连接可用来处理常规请求。如果 /currentCarLocation 的调用请求数超过 50 条,我们就设计一些备用逻辑进行处理,比如在界面上给用户进行提示。



(2)熔断

针对第二个问题,因那时 DB 没有死锁,流量洪峰缓存超时单纯是因为压力太大,此时我们可以使用 Basic Data Service 暂缓一点儿时间,让它不接受新的请求,这样 Redis 的数据会被补上,数据库的连接也会降下来,我们的服务也就没事了。

简单概括该解决技术需要实现以下2点需求:
1)发现近期某个接口的请求老出异常,先别访问接口的服务;
2)发现某个接口的请求老超时,先判断接口的服务是否不堪重负,如果不堪重负,先别访问它。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值