清华教授解密AIOps:智能运维如何落地?

随着 AI 技术在各个应用领域的落地及实践,IT 运维也将迎来一个智能化运维的新时代。算法的效率提升了 AIOps 的价值,通过持续学习,智能运维将把运维人员从纷繁复杂的告警和噪音中解放出来。

那么,基于算法的 IT 运维与自动化运维的区别是什么?在现阶段,运维中的哪些痛点适合引入人工智能技术?如何加速落地?

8 月 26 日下午 51CTO 在北京举办了第十四期以“Tech Neo”为主题的技术沙龙活动,进一步拓宽运维/开发人员的运维思路、激发创新能力。由清华计算机系副教授,智能运维算法专家裴丹为大家分享主题为“智能运维如何落地”的精彩演讲。
在演讲开始,裴丹教授通过运维背景介绍,普世化智能运维关键技术,意在让所有公司都能用上最好的智能运维技术。裴丹教授认为,解决智能运维普世化的问题在数据、算法、算力、人才四方面。

第二部分是分解定义智能运维中的关键技术,通过分解关键技术来定义科研问题。

裴丹老师指出的科研问题要求分别为:
清晰输入,数据可获得。 清晰输出,输出目标切实可行。 有 high-level 的技术路线图。 有参考文献。 非智能运维领域的学术界能理解、能解决。
裴丹教授还指出,Gartner报告中关于智能运维的问题描述太宽泛。智能运维如何做好?裴丹教授认为,机器学习本身有很多成熟的算法和系统,及其大量的优秀的开源工具。

如果成功的将机器学习应用到运维之中,还需要以下三个方面的支持:
数据。互联网应用本身具有海量的日志。需要做优化存储。 数据不够还需要自主生成。 标注的数据。日常运维工作会产生标注的数据。 比如出了一次事件后,运维工程师会记录下过程, 这个过程会反馈到系统之中, 反过来提升运维水平。 应用。运维工程师是智能运维系统的用户。 用户使用过程发现的问题可以对智能系统的优化起正向反馈作用。
裴丹教授通过与百度运维、搜索部门的合作,分享了智能运维的三个案例,包括异常检测、瓶颈分析以及智能熔断。第一个案例是基于机器学习的 KPI 自动化异常检测。
这里写图片描述
上图表示运维人员判断 KPI 曲线的异常并标注出来, 系统对标注的特征数据进行学习 。这是典型的监督式学习,需要高效的标注工具来节省运维人员的时间: 如可以拖拽,放大等方式。

最后,裴丹教授在通过构建 KPI 异常检测系统中分享了相关的实践与挑战等相关的解决方案。以下为演讲实录:
智能运维的发展历程
这里写图片描述
我们大家都知道,在运维发展的过程中,最早出现的是手工运维;在大量的自动化脚本产生后,就有了自动化的运维;后来又出现了 DevOps 和智能运维。

在运维的过程中,涉及到的步骤可以概括为:产生海量的监测日志,进行分析决策,并通过自动化的脚本进行控制。

运维的发展过程,主要是分析决策步骤发生了变化:起初,由人工决策分析;后来,在采集数据的基础上,使用自动化的脚本进行决策分析;最后,用机器学习方法做决策分析。
这里写图片描述
根据 Gartner Report,智能运维相关的技术产业处于上升期。2016 年,AIOps 的部署率低于 5%,Gartner 预计 2019 年 AIOps 的全球部署率可以达到 25%。所以,AIOps 的前景一片光明。

如果 AIOps 普遍部署之后会是什么样的呢?现在做运维的同学们会变成怎样?

从机器的角度,基础性、重复性的运维工作都交给计算机来做了;同时,机器通过机器学习算法为复杂的问题提供决策的建议,然后向运维专家学习解决复杂问题的思路。

从运维专家的角度,运维专家主要处理运维过程中的难题,同时基于机器建议给出决策和训练机器徒弟。

运维工程师将逐渐转型为大数据工程师,主要负责开发数据采集程序以及自动化执行脚本,负责搭建大数据基础架构,同时高效实现基于机器学习的算法。

机器学习科学家主要负责 AI 的落地应用,智能运维领域相对于其他 AI 应用领域的优势在于,我们不仅有大量的应用数据,而且有实际的应用场景和部署环境。

因此,人工智能在计算机视觉、自然语言理解、语音识别之外,又多了一个落地应用——这是一座尚未开采的金矿。

智能运维科研门槛高-工业界

一般有“前景光明”、“前途光明”这些词的时候,下面跟着的就是“道路曲折”。实际上,智能运维是一个门槛很高的工作。
这里写图片描述
为什么呢?因为智能运维需要三方面的知识:
我们要熟悉应用的行业,比如互联网、电信或者相对传统的行业,如金融、电力等等。 我们要熟悉运维相关的场景,包括异常检测、故障预测、瓶颈分析、容量预

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值