数据业务架构介绍
稳定性目标与保障
少出事
核心链路数据准确率:全年>=99,45%(2次/年)
快发现
核心链路问题(主动发现)时间 <= 5min
快恢复
P0核心链路恢复时间<= 5min:P1级(埋点相关指标,容忍度相对高)链路恢复时间 <= 10in
容量规划 - 容量监控

监控指标

发布规范
发布窗口
1、业务低峰期,非节假日前一天
2、离线12-16点,实时20-24点
3、非变更窗口需走紧急变更流程
发布内容、发布通知
1、发布背景、执行操作需描述清楚
2、通知业务方、执行方、次日Oncall
审核
1、方向负责人、组负责人审核
2、遵循Doris使用规范
3、不变更就必然产生稳定性风险或无法故障恢复情况下可提前变更,事后补充
四、验收
1、服务稳定性验收
2、服务功能性验收
3、异常快速回滚

文章介绍了数据业务架构中对稳定性的严格要求,包括核心链路数据准确率目标、问题快速发现与恢复的时间限制,以及容量规划和监控。此外,文章还详细阐述了发布规范,如选择业务低峰期进行发布,严格的审核流程和异常情况下的回滚策略。
5万+

被折叠的 条评论
为什么被折叠?



