嘉宾 | 文吉 整理人 | 巫柔颖
出品 | CSDN云原生
AIOps由Gartner于2016年提出,基于已有的运维数据(日志、监控信息、应用信息等),整合大数据和机器学习的能力,为IT运维管理产品提供支撑,进一步降低自动化运维中的人为干扰,最终实现运维无人化、自动化。
2022年8月30日,在CSDN云原生系列在线峰会第16期“AIOps峰会”上,用友畅捷通SRE负责人文吉分享了用友畅捷通是如何通过智能运维来提升稳定性保障的。文吉表示,“在线”成为时代的新本能,数智化是小微企业转型的必由之路,并从实际落地案例出发为大家提供建设新思路。
监控2.0到3.0
畅捷通成立于2010年,目前日活用户达45万,累计用户数超过690万,当前正在逐步从软件包模式向SaaS化模式转变。那么该如何保证稳定性快速落地并产生价值呢?
监控中心——认知和升级
从监控维度来看,监控中心的重要程度不言而喻,畅捷通在落地监控中心的过程中,发现了四个痛点问题。
• 业务模式从传统的软件包转变为 SaaS,用户体验要求越来越高。
• 监控指标越来越多,一个故障事件会引发大量告警,干扰元素杂乱。
• 如何把SRE经验沉淀到平台中,实现无脑值班模式。
• 如何落地 2 (及时告警)-5(初步定位)-10(快速止损)。
监控中心(打基础)——监控指标体系的建立和应用的自动化关联
监控中心若想实现“及时告警-初步定位-快速止损”,首先要打好基础。
• “有