Ganglia

转载 2016年04月28日 16:01:13

Ganglia集群监视项目,包括gmond、gmetad以及一个Web前端
Gmond :是一个守护进程,他运行在每一个需要监测的节点上,收集监测统计,发送和接受在同一个组播或单播通道上的统计信息 如果他是一个发送者(mute=no)他会收集基本指标,比如系统负载(load_one),CPU利用率。他同时也会发送用户通过添加C/Python模块来自定义的指标。 如果他是一个接收者(deaf=no)他会聚合所有从别的主机上发来的指标,并把它们都保存在内存缓冲区中。

Gmetad:也是一个守护进程,他定期检查gmonds,从那里拉取数据,并将他们的指标存储在RRD(RoundRobinDatabase,用于记录固定数目,具有循环特性,并且在当前时间点有特定值的数据)存储引擎中。他可以查询多个集群并聚合指标。他也被用于生成用户界面的web前端。

Ganglia-web :顾名思义,他应该安装在有gmetad运行的机器上,以便读取RRD文件。 集群是主机和度量数据的逻辑分组,比如数据库服务器,网页服务器,生产,测试,QA等,他们都是完全分开的,你需要为每个集群运行单独的gmond实例。
ganglia架构
ganglia架构

配置:
/usr/local/ganglia/etc/gmetad.conf
/usr/local/ganglia/etc/gmond.conf
/home/gangliaInstall/ganglia/ganglia-web-3.5.10/ganglia-web-3.5.10/ganglia-web/debian/conf.php

data_source "mycluster" THadoop1 THadoop2 THadoop3 THadoop4 THadoop5 THadoop6 TH
adoop7 THadoop8
xml_port  8651
interactive_port  8652
rrd_rootdir  "/home/gangliaInstall/ganglia/rrds"
case_sensitive_hostnames  0

data_source参数定义了集群名字,以及集群中的节点。由于采用multicast模式,每台gmond节点都有本Cluster1内节点机器的所有监控数据,因此不需要把所有节点写入data_source中。建议写入不低于2个,在host1节点死机的时候,会自动找host2节点取数据。
xml_port定义了一个收集数据汇总的交互端口,如果不指定,默认是8651,可以通过telnet这个端口得到监控管理端收集到的客户端的所有数据。
interactive_port 定义了Web端获取数据的端口,这个端口在配置Ganglia的web监控界面时需要指定。
rrd_rootdir参数定义了rrd数据库的存放路径,gmetad收集到监控数据后,会更新到该目录下的对应的rrd数据库中。

启动
service gmetad start
其他命令/etc/init.d/gmetad {start|stop|restart|status}

地址:
http://ip/ganglia

监控Hadoop集群需要配置
/letv/data/hadoop-2.6.0/etc/hadoop/hadoop-metrics.properties

Ganglia安装后会有两个进程,gmond gmetad。数据以xml方式显示
gmetad 负责对已有 监控数据的汇集工作,默认端口8651
gmond负责对本机状态的监控以及数据的发送,默认端口8649
ganglia的数据收集有推拉两种模式,gmond支持数据推送,gmetad是拉数据。

rrds目录:
/home/gangliaInstall/ganglia/rrds

参考教程:
http://ixdba.blog.51cto.com/2895551/1761003
http://www.uml.org.cn/sjjm/201305171.asp
http://www.dataguru.cn/article-3816-1.html
http://blog.csdn.net/iam333/article/details/16358509
http://sofar.blog.51cto.com/353572/1367205

Ganglia的安装配置

1. 在主节点上安装ganglia-webfrontend和ganglia-monitor sudo apt-get install ganglia-webfrontend ganglia-m...
  • xugen12
  • xugen12
  • 2015年09月05日 22:08
  • 682

Ganglia 分布式配置

关于对分布式文件系统的监控,主要分为两个部分:机器性能相关的监控 和 系统运行状态 的监控。 机器性能相关的监控:这个比较泛化,也比较成熟,主要是对CPU、内存、网络、磁盘I/O等信息的监控,我们没...
  • qq_26091271
  • qq_26091271
  • 2016年09月23日 22:15
  • 293

Ganglia的安装、配置、运行

一、安装ganglia: 网上示例很多,对该部分的翻译后续再跟进。 二、配置ganglia: 默认的配置仅仅能使ganglia工作,如果了解比默认配置多的配置项,能帮助你更好的使用ganglia做...
  • xhb306286215
  • xhb306286215
  • 2017年05月24日 09:12
  • 1413

ganglia-原理介绍(一)

ganglia原理以及配置较少
  • tryhl
  • tryhl
  • 2015年03月20日 17:22
  • 4905

Ganglia 权威指南-安装Ganglia过程

由Ganglia的设计者和维护人员亲自执笔,知识性和权威性毋庸置疑。本书不但展示了如何从任意规模的集群、网格或云基础架构中收集系统指标并使其可视化,而且为如何针对20 000台主机每10秒跟踪一次CP...
  • xxd851116
  • xxd851116
  • 2014年03月19日 13:44
  • 33839

Ganglia_简述

一、Ganglia概述 规模的问题Ganglia的运行和绝大多数监控系统是不一样的, Ganglia设计最大的考虑就是为了解决规模的问题。 主机即监控系统 基于冗余的结构Ganglia 假设用户主机存...
  • Regan_Hoo
  • Regan_Hoo
  • 2017年12月07日 16:19
  • 316

Ganglia系统监控

  • 2015年08月25日 12:06
  • 58.66MB
  • 下载

Ganglia 监控实战!

从系统管理员接手服务器和主机管理以来,像应用监控这样的工具就成了他们的好帮手。其中比较有名的有Nagios、 Zabbix、 Icinga 和 Centreon。以上这些是重量级的监控工具,让一个新手...
  • u014743697
  • u014743697
  • 2017年02月12日 08:43
  • 1816

我的ganglia配置过程

早就听说ganglia是HPC monitor的NO.1,可一直没时间安装,今天折腾了几乎一天,终于把ganglia配置好了,记下来安装过程以供同行参考!=======================...
  • zdmilan
  • zdmilan
  • 2006年09月20日 16:02
  • 11668

ganglia 安装配置指南

引言 Ganglia 是 UC Berkeley 发起的一个开源监视项目,设计用于测量数以千计的节点。每台计算机都运行一个收集和发送度量数据(如处理器速度、内存使用量等)的名为 gmond 的守护进...
  • gong_xucheng
  • gong_xucheng
  • 2014年05月20日 16:56
  • 11361
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Ganglia
举报原因:
原因补充:

(最多只允许输入30个字)