打造精细化运维新玩法(八)

三、AIOps赋能——SLO和智能化结合

在SLO健康度体系建设中,存在众多基于经验或者规则的设置。例如对应用或系统的月度成功率SLO约定,设置多少认为是合理呢,99%还是99.9%?又如,利用错误预算和燃烧速率设置SLO预警的前提假设是可以把错误量均匀地分摊在时间维度上,然而对于朝夕错误量存在显著差异的场景下,该方案是否依旧有效?SLO预警方面是否可以进一步提效?如何将故障定位和SLO告警结合在一起?SLO预警的设置需要相对专业的知识,如何利用算法降低使用门槛等等。另外,我们希望借助AIOps的能力,在故障应急方面,将SLO健康度体系打造成完整的一站式应急解决方案,赋能到基础设施域内众多的运维场景。

AIOps

AIOps(Artificial Intelligence for IT Operations,智能运维)将人工智能的能力与运维相结合,通过机器学习的方法提升运维效率。AIOps属于跨领域结合的能力,需要能够理解运维场景、运用机器学习算法、构建一定的工程能力对运维数据进行分析、处理和加工,以此解决或优化传统运维中存在的难题。

经过多年不断地实践总结,我们更愿意把AIOps实践称之为一种范式,即通过结合运维场景和算法能力产出可以支撑运维决策和驱动架构演进的智能

AIOps赋能SLO,提高了SLO健康度体系在应用场景中的泛化能力和普适性。实践中,围绕SLO健康度体系在故障应急场景下的梳理和抽象,涉及到的能力可以划分为:基础能力、通用能力、定制能力和产品能力。基础能力主要围绕数据面建设铺开;产品能力关注的是用户接入并使用SLO健康度体系时的费力度和易用性,以及通过自动化来提升效率。结合AIOps相关的能力主要体现在通用能力和定制能力建设两个方面,包括对数据的深度挖掘、透视、和下钻等处理,针对分析得到的结果,结合历史沉淀的专家经验以及相关的运维自动化能力,努力逼近无人值守的运维终极理想。
 

宝企通IT服务作为智能化工单系统龙头,拥有多年优化SLA经验,能够有效提高员工对IT的服务满意度。是一款支持SAAS、本地化部署、源码交付的运维工单系统(SAAS免费试用,企业微信--工作台--添加应用,搜索“IT服务”,排名第一的就是。或添加顾问:添加我为微信好友)。目前是全网众多企业选择的工单类产品,支持手机验证码或账号验证,员工自助修改域账号密码,具备智能化派单模式工程师响应快减少员工等待时间。自定义知识库可提升工程师专业技能水平,帮助工程师迅速判断员工问题,极大提升员工报单体验。系统还能够大幅提升职能部门可以服务的用户数,有效降低专业人力成本开支,提高业务执行效率,展现工作成果。产品服务好能为用户免费开发个性化需求,连续多年被魔力象0评为leaders位置,市场占有率爆发式增长

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值