说明:该文章是对阿里巴巴高级技术专家 王肇刚在2018年云栖大会-上海峰会上分享的《AIOps智能监控在阿里巴巴集团的成功实践》内容的学习总结。
一、如何孵化AIops能力,要从技术架构和团队架构着手
至于团队架构,我觉得《AIops企业实施白皮书》上的一样
二、我看到的亮点:
2.1 整个故障处理流程链进行智能化。好多企业也许智能化了一个环节,阿里在群求运行指挥中心中把整个故障流程都智能化,我觉得还是挺厉害的。
2.2 智能基线监控
对于监控曲线,根据历史经验设立智能基线,当业务触发基线时候进行报警。主要分析包括 单指标多维下钻分析、多指标相关性分析。
2.3 智能监控体系还是比较健全