智能运维场景 | 业务全链路观测,以业务视角拉通全域数据,打造真正的运维可观测

现代企业的IT架构日趋复杂,从单体应用演进为分布式微服务架构,业务系统间的依赖关系也变得错综复杂。传统的监控方式局限于单点指标的采集和告警,难以应对跨服务、跨系统的复杂故障场景。业务全链路观测作为新一代智能运维的核心能力,正发挥着越来越重要的作用。

擎创一体化数智运维解决方案中的业务全链路观测场景通过综合利用调用链、日志、指标、配置、网络等不同领域的运维数据,构建以业务为观测视角的横向到边、纵向到底的端到端链路,提升了多系统同时告警时的业务影响分析能力以及快速故障定界能力。

典型用户画像

企业生产运行部

提供面向业务视角的预警以及影响分析能力,协助生产运行团队掌握受影响的业务范围和严重程度,辅助生产运维决策

企业应用二线运维人员

通过对业务以及应用路径的实时分析,基于路径和多维智能算法,自动识别和推荐异常终点,实现横纵两向的下钻及关联分析,协助应用二线运维人员快速识别根因故障边界,提高应急排障效率

场景价值和特性

图片

图片


案例-客户痛点

某国有大行的生产运行部,在每次出现故障问题的时候,仅能知道受影响的系统数量,很难直接找到重点,只能广播式召集,以至于业务影响分析十分困难

另外,该行还存在多系统横向排障困难的情况。企业二线应用/系统部仍保留传统人工方式,依赖经验判断上下游影响关系,常耗费大量时间去逐一对系统进行排查,且给出的处置方案具有不确定性,中间还牵扯大量的一二线重复沟通成本。

案例-实践路径

根据对该行整体运维阶段的评估,擎创给出两期建设规划。

1 一期(已完成)

  • 建设交易链路端到端的智能分析能力,兼容云上云下,并基于三大关键数据实现端到端追踪。
  • 协助一线值班团队定位多系统异常根因,提高客诉问题的排查效率
  • 辅助二线运维团队查看故障系统上下游、寻找错误、性能热点,定位故障对象

运维可观测系统架构

可观测系统架构

2 二期(建设中)

  • 梳理18个关键业务场景,实现关键业务的一键根因诊断
  • 优化业务影响分析旅程和体验,基于系统调用路径,提供系统级别的告警拓扑
  • 聚焦故障路径以及异常终点,增强从业务场景到链路的下钻分析能力

案例-建设收益

01 提供统一且完整的业务影响认知

面向一线生产运行部和二线运维团队提供统一且完整的业务影响分析视图,提高了一线生产运行团队的召集效率。

02 提升复杂故障的排查能力

综合利用链路、指标、日志、配置等领域的运维数据,实现从业务、应用、到基础架构的纵向下钻分析,关联分析链路、指标、日志等相关运维数据,协助二线运维团队快速确定故障边界,提高应急排障效率。

图片

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值