部署prometheus+alertmanager监控平台

一、编写目的

为满足运维监控告警需求,提高故障发现及时率。本文将着重描述grafana、prometheus、alertmanager、*exporter、django+uwsgi、python3、pip3安装

二、定义

  • grafana:监控数据可视化展现
  • prometheus:收集和存储时间序列数据
  • alertmanager:告警数据分类整理并通知
  • *exporter:包括各种数据监控组件,用于采集监控数据

三、硬件环境要求

需要准备单台配置为(CUP:2*12核,内存256GB,磁盘容量2TB+万兆以太网)及以上配置,至少2台及以上分布式集群环境中。

四、软件环境安装

操作系统CentOS7.5桌面版

五、Prometheus组件安装(Win环境部署)

1、安装 grafana
监控数据可视化界面,作为prometheus可视化界面的扩展,默认端口3000。访问路径:http://ip:3000/ 默认用户密码admin/admin。

解压:grafana-6.2.5.zip
管理员权限执行:grafana-server.exe文件即可。

2、安装prometheus
作为被监控主机web信息采集器,安装在被监控主机,作为监控主机,收集和存储时间序列数据,默认端口9090,可修改端口。访问路径:http://ip:9090/。

解压:prometheus-2.11.0-rc.0.windows-amd64.zip
管理员权限执行:prometheus.exe文件即可。

3、安装alertmanager
使用普罗米修斯进行警报分为两部分。Prometheus服务器中的警报规则会向Alertmanager发送警报。然后,Alertmanager 管理这些警报,包括静音,禁止,聚合以及通过电子邮件、Webhook等方法发送通知,默认端口9093,可修改端口。

解压:prometheus-2.11.0-rc.0.windows-amd64.zip
管理员权限执行:alertmanager.exe文件即可。

4、安装win服务器监控客户端,默认端口9182。

管理员权限执行:wmi_exporter-0.8.3-amd64.exe

五、Prometheus组件安装(Linux环境部署)

1、安装 grafana
监控数据可视化界面,作为prometheus可视化界面的扩展,默认端口3000。访问路径:http://ip:3000/ 默认用户密码admin/admin。

执行:rpm -ivh  grafana-6.0.2-1.x86_64.rpm
启动:systemctl start grafana-server
停止:systemctl stop grafana-server

验证:正常访问http://ip:3000/ 默认用户密码admin/admin

2、安装prometheus&&alertmanager
prometheus作为被监控主机web信息采集器,安装在被监控主机,作为监控主机,收集和存储时间序列数据,默认端口9090,可修改端口。访问路径:http://ip:9090/。
启动命令:

nohup /usr/local/bin/prometheus --config.file=/etc/prometheus/prometheus.yml --web.enable-lifecycle >>/var/log/prometheus/prometheus.log &

alertmanager使用普罗米修斯进行警报分为两部分。Prometheus服务器中的警报规则会向Alertmanager发送警报。然后,Alertmanager 管理这些警报,包括静音,禁止,聚合以及通过电子邮件、Webhook等方法发送通知,默认端口9093,可修改端口。
启动命令:

nohup /usr/local/bin/alertmanager --config.file=/etc/prometheus/alertmanager.yml >>/var/log/prometheus/alertmanager.log  &

3、安装linux服务器监控客户端:

  • node_exporter用于监控主机性能,必须安装在被监控主机上,默认端口9100。
  • process_exporter用于监控主机进程,必须安装在被监控主机上,默认端口9256。
  • blackbox_exporter可安装在监控主机用于监控该主机是否能正常连通其他主机端口,默认端口9115。
    启动命令:
nohup /usr/local/bin/node_exporter >>/var/log/prometheus/node_exporter.log &
nohup /usr/local/bin/process_exporter --config.path=/etc/prometheus/process_name.yml  >>/var/log/prometheus/process_exporter.log &
nohup /usr/local/bin/blackbox_exporter --config.file=/etc/prometheus/blackbox.yml  >>/var/log/prometheus/blackbox_exporter.log &

开放端口:

node_exporter端口9100
process_exporter端口:9256
blackbox_exporter端口:9115
postgres_exporter端口:9187
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这是一个比较复杂的问题,需要详细说明。我会尽可能地给您提供一些指导。 首先,您需要了解一些基础知识,如 Kubernetes 和 Prometheus。Kubernetes 是一个容器编排平台,可以帮助您自动管理多个容器应用程序的部署、扩展和故障恢复。Prometheus 是一个开源的监控系统,可以收集和存储应用程序的指标,并支持告警和可视化。 以下是大致的步骤: 1. 部署 Kubernetes 集群,并准备好部署 Prometheus 和 Grafana 的节点。您可以使用各种 Kubernetes 发行版,如 kops、kubeadm 等。 2. 安装和配置 Prometheus。您可以使用 Prometheus 的 Helm Chart 进行部署,并通过 Prometheus Operator 进行管理。在部署 Prometheus 时,您需要配置它来收集应用程序的指标,并将其存储在 Prometheus 存储中。 3. 部署 Grafana。您可以使用 Grafana 的 Helm Chart 进行部署,并配置它来连接到 Prometheus 存储。在 Grafana 中,您可以创建仪表板并可视化 Prometheus 存储中的指标数据。 4. 配置告警。您可以使用 PrometheusAlertmanager 进行告警,并将告警发送到 Slack、Email 等渠道。在配置告警时,您需要定义告警规则,并配置 Alertmanager 来发送告警。 以上是部署 Prometheus、Grafana 和告警的大致步骤。由于每个环境的部署和配置都有所不同,所以具体的细节可能会有所不同。我建议您查阅官方文档,并根据您的需求进行调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值