走出 AIOps 的误区:高估的模型、低估的数据

智能运维(AIOps)的概念自 2016 年被 Gartner 提出以来,AI 技术越来越多地被应用到运维领域。随着云计算、大数据、人工智能等技术的高速发展和普及,AIOps这个名词的出现频率不断提升,大有不AIOps 就要落伍的感觉。但是,真正想把 AIOps 的先进理念落实到运维体系中,产生实际有效的效果,并不是轻而易举的事。理想很丰满,现实很骨感。

究其原因,很大程度上源于一个AI 领域中普遍存在的误区,那就是对各种机器学习、深度学习的算法、模型过于期待和迷信,而忽略或低估了数据准备和数据质量的重要性。正如最近谷歌研究人员在论文Everyone wants to do the model work, not the data work (《人人都想搞模型,而不想搞数据》)中指出的,虽然数据工作是耗时而且被低估的工作,但是因数据问题产生的负面影响会非常明显地影响到最终的模型效果。
在这里插入图片描述

本文就尝试带读者暂别聚光灯下的各种AIOps 智能算法,而一起梳理一下这些被低估的AIOps 数据工作的脉络。Gartner 在2021 年 AIOps 市场报告中指出,AIOps 系统的核心功能中包括:

数据摄入 收集来自各种来源的异构数据,包括但不限于日志、事件、可观察性或监控数据、拓扑、跟踪数据等。

数据增强 完成数据扩展、发现并组装包括软硬件体系的IT 资产统一拓扑结构。

事件关联 将事件关联并压缩到高层事件,减少噪音和不必要的人为干预。

根因识别 实现对事件原因的检测和分析。

实施补救 通过提供建议、自动回应或触发外部自动化系统实施补救。

根因识别和实施补救的功能更加偏重于算法分析和自动化执行,在本文中限于篇幅我们暂且不重点关注,下面我们就针对前三个AIOps 的核心功能具体介绍一下为有效实现这些能力需要完成的底层数据工作有哪些。

数据摄入

AIOps的可观察性数据基础要求包括摄取静态的历史数据和动态的实时流式数据。这个过程中容易被忽略的一个关键点是,数据摄入不是独立于后续的数据分析和处理而单独存在的。数据摄入需要能够支持后续分布式分析,需要支持数据能够直接在摄取点进行实时分析,并且支持对多个数据流进行关联分析。

那么,AIOps 需要的数据源都有哪些,以及如何利用呢?如果从 AIOps 的目标来分析,数据源的问题就比较容易理解了。AIOps 平台的目的是将以前锁定

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值