服务雪崩的解决思路

wangJiaLun-china

已于 2022-03-24 10:02:26 修改

阅读量382

点赞数 1

分类专栏：微服务文章标签： java 分布式

于 2022-03-09 16:32:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/al961105114/article/details/123380906

版权

微服务专栏收录该内容

6 篇文章 0 订阅

订阅专栏

服务雪崩

服务雪崩效应是一种因“服务提供者的不可用”（原因）导致“服务调用者不可用”（结果），并将不可用逐渐放大的现象

如下图：一个服务失败，导致整条链路的服务都失败的情形，我们称之为服务雪崩

我把服务雪崩的参与者简化为 服务提供者 和 服务调用者，并将服务雪崩产生的过程分为以下三个阶段来分析形成的原因:

服务提供者不可用
重试加大流量
服务调用者不可用

服务雪崩的每个阶段都可能由不同的原因造成，比如造成 服务不可用 的原因有:

硬件故障
程序 Bug
缓存击穿
用户大量请求

硬件故障可能为硬件损坏造成的服务器主机宕机，网络硬件故障造成的服务提供者的不可访问。
缓存击穿一般发生在缓存应用重启，所有缓存被清空时，以及短时间内大量缓存失效时。大量的缓存不命中，使请求直击后端，造成服务提供者超负荷运行，引起服务不可用。
在秒杀和大促开始前，如果准备不充分，用户发起大量请求也会造成服务提供者的不可用。

而形成 重试加大流量 的原因有:

用户重试
代码逻辑重试

在服务提供者不可用后，用户由于忍受不了界面上长时间的等待，而不断刷新页面甚至提交表单。
服务调用端的会存在大量服务异常后的重试逻辑。
这些重试都会进一步加大请求流量。

最后, 服务调用者不可用 产生的主要原因是:

同步等待造成的资源耗尽

当服务调用者使用 同步调用 时，会产生大量的等待线程占用系统资源。一旦线程资源被耗尽，服务调用者提供的服务也将处于不可用状态，于是服务雪崩效应产生了。

应对策略

针对造成服务雪崩的不同原因，可以使用不同的应对策略:

流量控制

网关限流
用户交互限流
关闭重试

因为 Nginx 的高性能，目前一线互联网公司大量采用 Nginx+Lua 的网关进行流量控制，由此而来的 OpenResty 也越来越热门。

用户交互限流的具体措施有: 1. 采用加载动画，提高用户的忍耐等待时间。2. 提交按钮添加强制等待时间机制。

改进缓存模式

缓存预加载
同步改为异步刷新

服务自动扩容

AWS 的 auto scaling

服务调用者降级服务

资源隔离
对依赖服务进行分类
不可用服务的调用快速失败

资源隔离主要是对调用服务的线程池进行隔离。

我们根据具体业务，将依赖服务分为: 强依赖和若依赖。强依赖服务不可用会导致当前业务中止，而弱依赖服务的不可用不会导致当前业务的中止。

不可用服务的调用快速失败一般通过 超时机制, 熔断器 和熔断后的 降级方法 来实现。

wangJiaLun-china

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
服务雪崩的解决思路

服务雪崩服务雪崩效应是一种因“服务提供者的不可用”（原因）导致“服务调用者不可用”（结果），并将不可用逐渐放大的现象如下图：一个服务失败，导致整条链路的服务都失败的情形，我们称之为服务雪崩我把服务雪崩的参与者简化为服务提供者和服务调用者，并将服务雪崩产生的过程分为以下三个阶段来分析形成的原因:服务提供者不可用重试加大流量服务调用者不可用服务雪崩的每个阶段都可能由不同的原因造成，比如造成服务不可用的原因有:硬件故障程序 Bug缓存击穿用户大量请求硬件故障可能为硬件
复制链接

扫一扫

专栏目录

wangJiaLun-china CSDN认证博客专家 CSDN认证企业博客

码龄10年

37: 原创

6万+: 周排名

24万+: 总排名

4万+: 访问

: 等级

527: 积分

1569: 粉丝

30: 获赞

7: 评论

94: 收藏

私信

关注

热门文章

分类专栏

就是玩儿 3篇
并发 3篇
netty 2篇
mysql 3篇
nginx 10篇
微服务 6篇
CI/CD 1篇
eureka 3篇
fastDFS 1篇
elasticsearch 1篇
redis 5篇
rabbitMQ
maven 1篇
网络 1篇
keepalived 3篇

最新评论

公网ip经常变动的解决方法
明天的云: 不懂就问，这个脚本是运行在家里的电脑上吗？那电脑就必须24小时开启？
公网ip经常变动的解决方法
wangJiaLun-china: 。。。会来电的。路由器夜里会定时重启
公网ip经常变动的解决方法
惜晴晴: 你的路由器都断电了就算ip不变也不能用啊
公网ip经常变动的解决方法
wangJiaLun-china: 公网ip被运营商换了之后，直到定时任务检测到变更再修改dns解析记录。这段时间服务请求不通。网络波动的话，和这个动态切dns解析的关系不大。常见的http可以使用失败重连机制，socket服务可以尝试约定报文首尾或者报文长度这些方案处理丢包粘包问题。
公网ip经常变动的解决方法
小可耐muamuamua: 这种方式不是会经常存在网络抖动吗比如自己搭建了一个服务在自己使用的时候就因为网络抖动导致数据丢失

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。