超级App运维体系
监控
度量指标(性能,电量,流量,内存,稳定性)
覆盖率,极端闪退、启动卡死
实时查找用户出错信息
问题归纳到模块中
问题指标化分布(如启动时间的区间分布情况)
诊断
诊断方式(推拉结合、白名单)
推拉结合:下指令可以得到用户的诊断信息,或用户主动上传诊断信息
诊断成功率:(性能稳定性100%)
修复
多种手段(在线配置,自动熔断&修复,热修复)
修复本身的可靠性保证
hotpatch成功率99%
线上异常监控
客户端:量化、全面
服务端:异常分析,提取特征;合并数量,预测风险;模块化,自动分配业务线。
数据分析:实时数据解析;多种数据维度,均值,分布。
电量指数的计算
系统级数据采集:BatteryStatsHelper -> BatteryServiceImpl -> batterystats.bin
电量消耗模型:
维度:cpu, wakeup,wakelock,wifi,tcp,wifiscan,sensor
快速定位与诊断
便捷的获取辅助信息 -> 自动分配到人 -> 快速定位
电量诊断:自动收集cpu sensor vakelock等所有耗电数据
多层次的动态化技术
配置同步(rcs) |
H5 |
跨平台框架(hcf) |
Hotpatch |
Native |
支持整个模块的替换
架构的容灾能力:
配置1 配置2 ...
|
|
|
v
智能匹配精准容灾 <- - - 异常特征队列