业务监控区别于基础架构提供的网络、磁盘、内存、CPU等系统基础监控,通常基于业务场景自定义指标,对于线上系统功能的健康度可以有更直观的体现,监控的技术栈层面越高,监控现象越容易。下面,结合我在某公司跨境结算部门的实习经历,记录一下如何对跨境结算业务做监控,希望对以后的工作有所帮助。
业务特点
以一个简单的提现为例(只展示主流程,隐藏掉业务细节),涉及到的流程时序如下:
可以看到结算业务的特点:
- 涉及到内部和外部系统,上述业务涉及到3个内部系统(结算系统、提现系统、渠道网关),和一个外部系统(外部渠道);
- 有一些定时任务,为了尽可能保证数据一致性,支付相关系统通常会有一些补偿任务,用于对同步流程卡住的“订单”进行异步补偿,比如如果上述第4步提现系统调用渠道网关超时后,提现单状态为INIT,需要有补偿任务将该INIT的提现单重新发起提现;
- 系统都有各自的状态:一般来说,结算系统会有自己的状态(结算单),提现