一、 弹性伸缩组聚合监控原理
采用openfalcon中集群聚合模块(aggregator)来实现对弹性伸缩组中的所有的主机进行查询某个Counter(如:cpu.busy)的最新值,使用”分子:$(Counter) 分母:$#”的配置方式来实现对弹性伸缩组内所有主机的Counter值的采集(其中$#表示的是能够正常查到数据的机器数量),上报到transfer模块,从而达到对弹性伸缩组中所有有效主机的监控。配置样式如下图:
二、 集成思路
在添加弹性伸缩组时,会创建主机组和模板。
1)首先根据主机组的id来创建对该主机组内所有主机的聚合监控,在这个过程中会定义一个集群监控指标;
2)然后集群聚合模块采集完主机组的数据后会进行处理并上报到指定的Endpoint,上报的数据就是集群监控指标数据;
3)弹性伸缩组绑定的模板中要设置该集群监控指标数据的阈值,用来进行弹性伸缩组的监控告警判断的触发条件。
主机组中绑定的主机要包含Endpoint,这样才能满足条件时进行触发监控告警,所以整个弹性伸缩组中平均指标的监控重点有三个:
1.确定集群监控指标
2.确定集群监控指标数据上报的Endpoint
3.确定主机组绑定的模板中设置有集群监控指标数据的告警阈值。
总结,由于弹性伸缩组中的endpoint不断变化,而绘图需要的endpoint只有确定才能保证图表数据的连续性ÿ