数据业务架构介绍
稳定性目标与保障
少出事
核心链路数据准确率:全年>=99,45%(2次/年)
快发现
核心链路问题(主动发现)时间 <= 5min
快恢复
P0核心链路恢复时间<= 5min:P1级(埋点相关指标,容忍度相对高)链路恢复时间 <= 10in
容量规划 - 容量监控
监控指标
发布规范
发布窗口
1、业务低峰期,非节假日前一天
2、离线12-16点,实时20-24点
3、非变更窗口需走紧急变更流程
发布内容、发布通知
1、发布背景、执行操作需描述清楚
2、通知业务方、执行方、次日Oncall
审核
1、方向负责人、组负责人审核
2、遵循Doris使用规范
3、不变更就必然产生稳定性风险或无法故障恢复情况下可提前变更,事后补充
四、验收
1、服务稳定性验收
2、服务功能性验收
3、异常快速回滚