10张图带你彻底搞懂什么是限流、熔断、服务降级

最新推荐文章于 2024-08-28 23:44:36 发布

Java码农者

最新推荐文章于 2024-08-28 23:44:36 发布

阅读量834

点赞数

文章标签： java 分布式网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_67778103/article/details/123510096

版权

本文详细介绍了在分布式系统中防止雪崩的三种策略：限流、熔断和服务降级。限流通过限制系统处理请求的速度，防止过载；熔断通过断路器模式，当服务故障时快速失败，减少对系统的影响；服务降级则是对非核心功能进行简化处理，保障核心业务。文章深入探讨了各种限流指标和算法，如HPS、QPS、漏桶和令牌桶，并结合hystrix讲解了熔断和降级的实现方式。

摘要由CSDN通过智能技术生成

在分布式系统中，如果某个服务节点发生故障或者网络发生异常，都有可能导致调用方被阻塞等待，如果超时时间设置很长，调用方资源很可能被耗尽。这又导致了调用方的上游系统发生资源耗尽的情况，最终导致系统雪崩。

如下图：

如果D服务发生了故障不能响应，B服务调用D时只能阻塞等待。假如B服务调用D服务设置超时时间是10秒，请求速率是每秒100个，那10秒内就会有1000个请求线程被阻塞等待，如果B的线程池大小设置1000，那B系统因为线程资源耗尽已经不能对外提供服务了。而这又影响了入口系统A的服务，最终导致系统全面崩溃。

提高系统的整体容错能力是防止系统雪崩的有效手段。

在Martin Fowler和James Lewis的文章《Microservices: a definition of this new architectural term》[1]中，提出了微服务的9个特征，其中一个是容错设计。

要防止系统发生雪崩，就必须要有容错设计。如果遇到突增流量，一般的做法是对非核心业务功能采用熔断和服务降级的措施来保护核心业务功能正常服务，而对于核心功能服务，则需要采用限流的措施。

今天我们来聊一聊系统容错中的限流、熔断和服务降级。

1 限流

当系统的处理能力不能应对外部请求的突增流量时，为了不让系统崩溃，必须采取限流的措施。

1.1 限流指标

1.1.1 TPS

系统吞吐量是衡量系统性能的关键指标，按照事务的完成数量来限流是最合理的。

但是对实操性来说，按照事务来限流并不现实。在分布式系统中完成一笔事务需要多个系统的配合。比如我们在电商系统购物，需要订单、库存、账户、支付等多个服务配合完成，有的服务需要异步返回，这样完成一笔事务花费的时间可能会很长。如果按照TPS来进行限流，时间粒度可能会很大大，很难准确评估系统的响应性能。

1.1.2 HPS

每秒请求数，指每秒钟服务端收到客户端的请求数量。

如果一个请求完成一笔事务，那TPS和HPS是等同的。但在分布式场景下，完成一笔事务可能需要多次请求，所以TPS和HPS指标不能等同看待。

1.1.3 QPS

服务端每秒能够响应的客户端查询请求数量。

如果后台只有一台服务器，那HPS和QPS是等同的。但是在分布式场景下，每个请求需要多个服务器配合完成响应。

目前主流的限流方法多采用HPS作为限流指标。

1.2 限流方法

1.2.1 流量计数器

这是最简单直接的方法，比如限制每秒请求数量100，超过100的请求就拒绝掉。

但是这个方法存在2个明显的问题：

单位时间(比如1s)很难把控，如下图：这张图上，从下面时间看，HPS没有超过100，但是从上面看HPS超过100了。
有一段时间流量超了，也不一定真的需要限流，如下图，系统HPS限制50，虽然前3s流量超了，但是如果

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Java码农者 CSDN认证博客专家 CSDN认证企业博客

码龄3年

107: 原创

53万+: 周排名

142万+: 总排名

5万+: 访问

: 等级

1126: 积分

52: 粉丝

16: 获赞

10: 评论

79: 收藏

私信

关注

热门文章

最新评论

GitHub标星75k，阿里 2023年首次公开 MySQL 调优笔记PDF版，每个互联网人的救赎
程序员向阳: 请问怎么获取啊
阿里内部珍藏版的SpringBoot 实战笔记，含最新特性技术介绍
飞羽疾驰: 可以的，我看的另一个SpringBoot视频，从零开发，十天掌握了项目实战：https://knife.blog.csdn.net/article/details/134911141
GitHub标星75k，阿里 2023年首次公开 MySQL 调优笔记PDF版，每个互联网人的救赎
Wickor: 你好，请问链接在哪里？谢谢
4个实验，彻底搞懂TCP连接的断开
dreamer'~: 引用「断网后 server 重启再恢复」断网后 server 重启再恢复，这种情况下应该是有这几种情况吧。在服务端没有开启KeepAlive的前提下，重启server端： 1、如果client一直不发送数据，那么client可能依旧保存着这条连接，而server端由于重启已经没有保存这条连接信息了（实际上可能无效）； 2、如果在client发送数据之前（或者超时重传未达到重传次数的上限），server就已重启恢复了，那么此时双方的消息收发依然是正常的，双方复用之前建立好的连接； 3、如果在client发送数据无响应，且超时重传无响应直到主动断开了该条连接之后，server才重启恢复，那么这条连接就不存在了，需要重新创建连接。因此，主要需要看两个条件： 1、在服务端没有开启KeepAlive的前提下，重启server端； 2、主动发送方是否有数据传输，并且是否发生了超时重传达到上限，主动断开连接的情况。
SpringBoot应用部署到K8S上，用着像Docker
嘿！宝贝，此刻想我没: 写的真的乱

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。