【导读】运维团队工作中存在一个比较普遍的问题:在跨领域、跨业务的运维工作中,不清楚一个服务的上下游服务是什么,服务依赖了哪些基础设施,这些基础设施的运行状态如何等等的,因此,基于云原生和CMDB理念的数字化运营需求越来越明显……
1 研究背景
1.1 发展现状
1.1.1 容器云平台
我行生产环境使用的永定云平台是一个基于 K8S 开源软件自研的管理平台,承载了分布式核心、柜面等九十余个容器化应用系统,通过集成 SkyWalking、ELK 等云原生开源组件,实现了日志、监控等基础运维能力,但是微服务之间的调用关系不能一目了然。
1.1.2 SkyWalking
目前我行容器云APM监控工具采用SkyWalking,可以提供分布式追踪、服务网格遥测分析、度量聚合和可视化一体化解决方案。下图是SkyWalking 追踪到的链路图示例,它可以展示出应用之间的关系及一些性能指标,但是单个微服务和其他服务之间的拓扑关系只能显示一层,所以这些服务的从属关系和依赖关系不能清晰地展示。
1.1.3 CMDB配置管理库
我行的综合数字运营平台是定位于支撑运营中心数字化转型的核心平台,存储了从应用系统到各类软硬件资源的运维主数据。下图是平台上的CMDB配置管理库中的一个拓扑关系图,图中可以看到,CMDB中可以展现出容器上的各种资源信息以及这些资源间的关联关系。虽然能