日常运行 稳定性能架构设计:
大系统小做:
服务专一性
独立的功能拆分为独立的服务
依赖稳定性原则:
只依赖稳定的服务
将易变的部分拆分
超时中断
保障用户体验的容错设计:
异常情况下客户端的呈现
客户段配合限流
客户端配合降级
全链路压测:
事前预警:
性能大盘:
CPU Idle
DB读,写QPS
TP90 响应时间
超时率
业务监控:
业务大盘
脚印系统
简况分析:
指标变化趋势
事故处理:
回滚
分流
启动降级预案
限流
保证用户体验:
客户端配合降级
力保关键路径:
非关键路径模块降级
系统稳定性的处理原则:
力保证关键路径
性能是功能的一部分
上下游超时的约定
稳定是功能的一部分
超时 重试 幂等