测试监控系统框架构想
测试监控系统框架构想:
1. 主要工具:ganglia 和 nagios
2. 结合各自工具的特点,ganglia实现指标收集,nagios实现告警
Ganglia:实现完备的、面向测试任务的指标体系(完备、灵活、已扩展)
1. 现有系统指标及扩展指标的视图需要优化,太过分散,不够面向测试任务。
2. hadoop及相关业务系统已经大多支持Ganglia的metrix指标输出,熟悉起架构并按需扩展。
3. ganglia自身的指标是基于机器的,不是基于进程的,进程层面的监控使用ganglia扩展功能
Nagios : 全面清晰的系统状态及告警信息展现
1. 优化视图,面向测试任务
2. 实现快速的监控指标汇报,及各种告警方式
目前技术公共点 :
1. Nagios扩展能力,新增监控指标的能力
2. Ganglia的扩展能力(初步具备)
3. Ganglia的视图及Nagius的视图整合能力
4. 业务层面Ganglia指标的架构及实现