两码一号（九）：业务监控

最新推荐文章于 2023-02-09 11:06:00 发布

【江湖】三津

最新推荐文章于 2023-02-09 11:06:00 发布

阅读量660

点赞数 1

分类专栏：学习积累文章标签：业务监控标准化自动化智能算法应急处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38002497/article/details/106360067

版权

学习积累专栏收录该内容

17 篇文章 3 订阅

订阅专栏

背景
大部分业务监控都是业务同学自己按照需求配置，业务间的监控一般无法感知到。这种玩法存在一些问题：

日志格式不标准，大部分都是自己用
监控配置繁琐，阈值调整反反复复，新产品上线需要从头来一遍
业务间的监控不好做，彼此口径不统一
应急处理时不同平台间无法统一口径

主要痛点就是监控零散、配置繁琐、应急效率低。

新生态业务监控
为解决目前的监控痛点，我们推出了基于两码标准建设的业务监控lego。通过两码的标准化管控，实现业务口径的统一、标准管理。

所谓生态是指监控体系的发现、定位、变更、预案等，基于这套标准，大家统一口径后能实现互通。

在这里插入图片描述

下面详细介绍新业务监控的玩法。

数据标准化
通过标准日志格式，来统一管控业务唯一标识。不同系统通过业务标识来沟通，达到口径一致的效果。标准日志格式主要包括：

非扩展区域，每个字段的含义都是固定的，可枚举的字段，枚举值是固定

比如产品码=收钱码，事件码=支付，结果=成功，就很容易计算出"收钱码业务的支付笔数"。

扩展区域，支持业务自定义数据打印，但是必须可理解/管控。以服务端日志举例，以K-V形式打印（key1=value1, key2=value2,…)，其中key 要求提前申请，确保同样语义的业务含义的key定义是一致的。比如 pid=2088xxxxxxx(张三烧烤的店铺ID)，再结合非扩展区域，就可以衍生出"张三烧烤的收钱码的支付笔数"。

目前在蚂蚁，SPM、两码规范，分别从客户端/服务端视角进行了业务身份的定义，在这里不进行展开,相关文档见 https://lark.alipay.com/dc/antlogmng/vm5i1z https://lark.alipay.com/architecture/doc/hfsvf3

通过标准日志格式，我们就有了最基础的能力：

统一的业务语义
清晰的产品地图
自动的生命周期管控

数据模型化
基于标准数据，监控系统就可以设计出一套模型，标准数据进入模型后，自动完成监控部署。监控领域模型有兴趣可以看下lego的专题文章。

监控部署自动化
有了标准的日志，日志的切分就是标准化的，数据计算也是标准化的；通过标准数据建模，就可以自动完成监控初始化。简单说就是：

日志上线后，数据采集、数据计算、数据建模就自动完成了。

智能算法引擎
通过机器学习的能力来简化人工调整阈值的过程，lego的算法模块包括离线和实时两部分，通过协作完成动态阈值调整。

在这里插入图片描述
应急体系
有了业务唯一标识，不同平台间的互通就具备了。lego的监控告警发生后，就可以用唯一标识去查询其他兄弟平台的数据，提供给应急同学分析，达到快速应急恢复的要求。

【江湖】三津

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

【江湖】三津 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。