此文档用于交流学习,转载请注明。可以加入群316297243一起学习
1 Ganglia的概述
Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能,如:cpu 、mem、硬盘利用率,I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。
看下ganglia监控的一个图:
可以很只直观的观察系统的各个指标,特别是对于分布式系统来说,无疑非常重要,而且Hadoop,Hbase提供了集成了ganglia的配置文件。
2 工作原理以及配置简介
2.1 组成
在了ganglia的组成之前,先来看下一张图
从上图可以很直观的看到,一个监控系统大概包括:
Gmond,gmetad,rrdtool,Apache,PHP以及一个展示的web
监控的集群节点的步骤如下:
第一步:在要收集的数据的每个节点安装gmond,主要用来收集节点的信息以及存储信息(这里的存储信息在后面会讲解)
第二步:只要部署在一台机器就可以了(部署在我们需要通过web访问的机器上),主要用来轮询收集gmond的信息,并以某种形式存储到磁盘上。
第三步:安装apache web服务器,以及php(由于gweb是php开发的),构建gweb的执行环境
第四步:安装gweb