01. 背景介绍
对于企业的生产环境而言,监控与报警不可或缺的,完善的监控与及时的报警和自动化处理,可以帮助企业快速定位并解决问题,从而减少经济损失。
腾讯云事件总线(EventBridge)是一款安全、稳定、高效的无服务器事件管理平台。事件中心的事件总线可以接收来自您自己的应用程序、软件即服务(SaaS)和腾讯云服务的实时事件及相关数据流,通过集成消息推送和 SCF 云函数,实现告警信息的实时通知和自动化处理。
本文以服务器异常为例,为您介绍当云服务器产生告警事件后,如何基于 EventBridge 事件总线和 SCF 云函数,实现告警消息的实时推送和硬盘快照的自动回滚,完成自动化运维架构的快速搭建。
02. 架构设计
整体架构设计如图,从图上可以看出,当云服务器某台机器出现异常告警, CVM 会自动产生告警事件并主动推送给 EB,经过 EB 绑定的告警规则筛选后,完成到通知渠道的消息触达及时通知到用户,同时触发云函数,以调用 API 的方式完成硬盘快照的快速回滚,保证业务及时恢复。
03. 基本步骤
- 登录云函数控制台新建云函数,通过调用 API 的方式,完成服务器故障后自动处理流程的函数代码编写