百度智能故障自愈实践
1. 故障自愈背景介绍
2. 单机房容灾能力建设
3. 监控流量调度平台
4. 单机房故障自愈解决方案
12月8日-9日,百度智能云资深研发工程师张柳青受邀出席全球架构师峰会(ArchSummit),发表了“百度智能故障自愈实践”主题演讲,分享了百度智能云IOP团队在单机房故障自愈方面的实践经验,与来自阿里、腾讯、滴滴、微博等公司的技术专家共同探讨新一代运维(AIOps)的技术架构和发展趋势。参会的业界同行通过柳青的演讲,对百度智能异常检测与网络/业务故障判断策略、内外网流量调度和机房故障自动止损解决方案有了深入的了解,学习了新一代运维(AIOps)的先进实践经验。
百度AIOps实践:单机房故障自愈
1. 单机房故障自愈的必要性
2. 单机房容灾能力建设
3. 故障发现&止损平台
4. 单机房故障自愈解决方案
10月19日-21日,百度监控平台技术负责人哈晶晶受邀出席第九届中国系统架构师大会(SACC),发表了“百度AIOps实践:单机房故障自愈”的主题演讲,分享百度智能化运维平台建设经验和单机房故障自愈解决方案。百度提出基于AIOps的故障自愈通用化解决方案,主要包括:
书同文:运维知识库,一致运维语言;
车同轨:运维开发框架,一致运维方法;
行同伦:运维策略库,一致运维模式。
晶晶与来自阿里、美团、SaltStack用户组等的技术专家围绕智能化运维和DevOps展开技术探讨与交流,为参会的系统运维、架构师及IT决策人士提供了智能化运维的先进经验及AIOps的最佳实践。
没有时间亲临全球架构师峰会和中国架构师大会聆听两位技术大牛的演讲?在AIOps智能运维后台回复“ArchSummit2017”或“SACC2017”就能获取百度运维专家在会议中分享的干货讲义!听说元旦假期和干货讲义更配哦!
↓↓↓ 点击"阅读原文" 【查看更多干货】