1、Ambari 中 alert 概述
Ambari 为了帮助用户鉴别以及定位集群的问题,实现了告警(Alert)机制。在 Ambari 中预告了很多告警,这些告警被用来监测集群的各个模块以及机器的状态。对于告警来说,主要有两个概念,一个是 Alert Definition,一个是 Alert Instance。
- Alert Definition 就是告警的定义,其中会定义告警的检测时间间隔(interval)、类型(type)、以及阈值(threshold)等。
- Alert Instance 就是告警的实例:Ambari 会读取 alert definition,然后创建对应的实例(instance)去定期执行这个告警。
2、Ambari 中 alert 的类型
Ambari 中的 alert 分为 5 种类型,分别是 WEB、Port、Metric、Aggregate 和 Script。
Alert 的检查结果会以五种级别呈现,分别是 OK、WARNING,CRITICAL、UNKNOWN 和 NONE。其中最常见的是前三种。
具体的区别见下面的表格。