作为一名互联网和软件从业人员,你一定听过监控告警系统,并且举双手赞成你的团队应该拥有它,今天就从以下几个方面聊一聊熟悉又陌生的监控告警系统:
- 什么是监控告警系统?
- 为什么需要监控告警系统?
- 监控告警系统的未来?
什么是监控告警系统
监控告警系统是一个软件系统,给用户提供监控、告警、通知的功能。可以用下图简单的描述:
监控
监控系统采集并存储监控对象的一个或者多个指标。这里提到了几个名词,稍加解释:
- 监控系统。对下采集一个或者多个监控对象的指标数据并存储,对上暴露接口供上层做应用图形化展示、告警评估、报表;
- 监控对象。在互联网和软件行业,可能是服务器、虚拟机等基础设施,也可能是apiserver、消息队列、数据库等软件;
- 监控指标。监控对象的某一特征,例如服务器的CPU利用率、apiserver的RPS等。一般会周期性的采集,采集方式包括但不限于:Agent主动推送到Server、Server从Agent拉取、Agent发布Server订阅等方式,其值跟时间相关,类似下面的数据:
2021.06.23 22:03:30 mem_usag