一、简介
无论是微服务还是大数据平台为了能够及时告知集群运行健康状态就需要使用监控去获取健康信息通过钉钉、微信、短信等方式告知,及时修复生产问题,确保集群健康运行,本文简单的对集群内存和资源使用情况进行监控。
二、组件版本
Grafana:grafana-6.4.3.linux-amd64.tar.gz
Prometheus:prometheus-2.13.1.linux-amd64.tar.gz
Exporter:node_exporter-0.18.1.linux-amd64.tar.gz
grafana:是一个图形化工具,它可以从多个数据源中读取数据,使用精美的图表来展示数据。
prometheus:普罗米修斯开源监控告警系统,可以理解为一个数据库+数据爬取工具,工具各处抓取来统一的数据,放入proetheus这一个时间顺序数据库中,是通过HTTP协议周期性抓取被监控组件状态,任意组件只要提供对应的HTTP接口就可以接入监控,不需要任何SDK或者其他的集成过程。
exporter:数据采集总称。
三、安装
准备服务器,一台安装Prometheus和Grafana,被监控机器安装Expo