一次线上的服务雪崩事故
整个系统不可用
级联效应
上游服务不可用
突发流量导致整个服务不可用
提高可用性:将单台设备转为多台负载均衡集群
提高性能:检查慢SQL,优化算法,引入缓存缩短单笔业务的处理时间
预防瞬时TPS激增,将系统限流作为常态加入系统架构
完善事后处理,遇到长响应,一旦超过规定窗口时间,服务立即返回异常,中断当前处理
加强预警与监控,引入elk,进行流量实时监控与风险评估,及时发现系统风险
完善制度,要求客户单据当日录入系统
如何有限避免雪崩效应?
出现瞬间大流量+微服务响应慢
采用限流方式进行预防
采用服务降级与熔断进行补救
Sentinel客户端
需要集成在Spring Boot微服务应用中
勇于接收来自Dashboard配置的各种规则
并通过Spring MVC Interceptor拦截器技术实现应用限流,熔断保护
部署 Sentinel Dashboard 仪表盘
利用下面的命令启动Dashboard
java -jar -Dserver.port=99100 sentinel-dashboard-1.8.0.jar