运维可视化|漫谈网络监控可视化

本文介绍了运维可视化在内网监控中的重要性,特别是如何通过改进的事件流图展示异常事件,帮助运维人员高效排查故障。文章讨论了传统表格展示的不足,并提出了一种结合时间、严重程度和机房的事件流图解决方案,使得故障事件的个体信息更加直观。
摘要由CSDN通过智能技术生成

640?wx_fmt=gif

作者简介

莫莫    百度资深前端研发工程师

640?wx_fmt=png

负责百度智能运维(Noah)相关产品的前端设计和研发,在运维数据可视化方向有着丰富的实践经验。



干货概览

运维可视化,核心是将所运维的服务、资源、设备的状态和正在发生的事件通过可视化的手段呈现出来,指导运维人员或者产品研发人员做出正确的运维决策。某种程度上,运维与可视化相辅相成,可视化程度越高,运维就越简单,运维效率也就越高

在运维的工作范畴中,实时监控对故障的发现和诊断起到至关重要的作用。今天,我们以监控中的一个重点场景-内网监控,来介绍可视化起到的重要作用。内网指的是一个公司的内部网络,包括机房内部网络和机房间的网络

异常事件可视化

当运维工程师发现自己负责的系统出现故障时,检查网络连接是否有异常,是故障排查流程当中的标准步骤。在这个场景中,工程师需要知道自己的系统所在的机房以及所依赖的网络通路是否存在故障,所以希望内网监控系统提供一个网络故障概览,展示在给定的时间段中相关机房的异常事件。

640?wx_fmt=png

最简单的方式是将所有的网络故障展示在表格当中。如上表所示,每一行代表一个故障事件,第一列表示故障关联的机房,第二列是故障的起止时间,第三列是故障的严重程度。这种展现方式存在以下三个问题:

  1. 不能第一眼看出哪些故障严重,哪些故障轻微;

  2. 不能直观感受到每个故障的持续时长;

  3. 很难知道在某一时刻哪几个机房同时存在故障。

当时间段很长,筛选出的故障事件很多时,表格会变得很长,就更加不利于工程师了解网络状况了。

为解决以上问题,我们需要在机房、时间、 程度三个维度上都能直观的展示故障事件。从时间跨度来想,有点事件流的感觉,似乎可以用事件流图来展示。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值