1,简介
Ganglia是一款为HPC(高性能计算)集群而设计的可扩展性的分布式监控系统
监视和显示集群中节点的个各种状态信息
🔺由运行在各个节点上的gmond守护进程采集CPU、内存、硬盘利用率、I/O负载、网络流量情况,然后汇总到gmetad守护进程
使用rrdtool存储数据
将历史数据以曲线方式通过PHP页面显示
特点:
良好的可扩展性
负载开销低,支持高并发
广泛支持分钟操作系统和cpu架构,支持虚拟机
2,组成
三部分组成
gmond:
守护进程
运行在每一个需要监视的节点
收集节点的信息并发送到其他节点同时接受其他系欸但发送的数据
默认监听端口8649
gmetad:
守护进程
运行在数据汇聚的节点
定期检查每个检测节点的gmond进程并获得数据
将数据指标存储在本地RRD存储引擎
webfrontend:
基于web的图形化监控界面
和gmetad安装在同一个节点
从gmetad取数据,并读取RRD数据库
通过rrdtool生成图表,用于前台展示
3,工作原理
几个名词:
node:Ganglia监控系统中的最小单位,即被监视的单台服务器
cluster:表示一个服务器集群,由多台服务器组成,是具有相同监控属性的一组服务器集合
grid:表示一个网格。有多个服务器集群组成
🔺(1)数据流向(工作原理)
(2)工作模式
单播:可以跨越不同的网段
多播:同一网段内所有的机器,同时业界搜同一网段内所有机器发送过来的监控数据
同一网段内,可以定义不同的发送通道