智能运维的突出特点是具有多样化的异构数据的综合分析能力,与传统监控工具大都聚焦在一定范围,重点解决某一类问题(如网络监控、基础架构监控、应用监控、交易监控等)不同,智能运维将运维作为一盘棋,通过产品的组合、算法的组合,汇总各种数据,最终得到一个全面、综合的结论。智能运维之前,运维数据是孤立的,随着运维复杂度的提高,监控数据量不断增大,智能化的投入/产出的优势才能体现出来,这也是为什么最近几年智能化开始受到普遍关注的原因。——摘自金科创新社采访文章《【专访】必示科技刘大鹏:深度融入场景,AI技术决定智能运维落地效果》
关于智能运维如何落地:
智能运维落地,应综合考虑企业运维现状、基础能力等因素选择成熟度高、可以即刻投产使用的场景。在刘大鹏看来,目前成熟场景主要有两类:一是故障预警,包括针对时序监控指标异常检测和预测,针对日志数据的异常检测。目的是尽量提前、尽早发现系统中的潜在风险或故障;二是故障定位,包括对实体对象(机器、数据库、中间件等)、多个系统和业务维度的异常定位。目的是发现风险信号后,综合各种线索找出故障点。这两类场景下又有一些细分领域,如故障预警包括:针对时序监控的异常发现、针对日志数据的异常发现、针对业务容量或系统容量指标的预测;故障定位包括:针对实体对象的异常定位、针对多个系统的异常定位、针对业务维度的异常定位。