prometheus监控系统规范与流程

概要

本文档主要介绍监控的使用方法、监控的配置规范以及监控的使用流程。

简介:

监控使用的架构为exporter+prometheus+grafana+alermanager。其中exporter包含主机,http/tcp和进程探测等功能。prometeus通过pull的方式采集机器上的指标并评估指标,将符合rule规则的指标推送至alertmanager,alertmanager通过各种渠道推送相应的告警。grafana展示prometheus采集的各种指标。监控简要架构图如下:
监控架构概要图

一、部署规范

说明:
部署规范主要涉及配置文件路径规范、端口规范
配置文件路径规范,以及端口规范如下表:

部署规范
服务或说明 端口 配置文件路径或目录 说明
目录概要
/data/monitor/bin 所有监控可执行程序目录
/data/monitor/etc 监控各个模块的程序配置目录
/data/monitor/dis 服务发现
 /usr/lib/systemd/system 服务自启动目录
prometheus 9090 /data/monitor/etc/prometheus.yml 主配置文件
/var/lib/prometheus tsdb存储路径
/data/monitor/prometheus-2.28.1.linux-amd64/consoles console模板路径
/data/monitor/prometheus-2.28.1.linux-amd64/console_libraries console lib
/data/monitor/rules 规则文件
node-exporter 9100 /data/monitor/bin/node_exporter 二进制启动文件
process-exporter 9256 /data/monitor/etc/process_define.yml process-exporter配置文件
/data/monitor/dis/process_dis.yml process-exporter配置文件(prometheus端)
blackbox-exporter 9115 /data/monitor/etc/blackbox.yml blackbox-exporter配置文件(模块)
/data/monitor/dis/blackbox_dis.yml blackbox-exporter配置发现文件(prometheus端)
alertmanager 9093 /data/monitor/etc/alertmanager.yml 主配置文件
/var/lib/alertmanager/data 告警信息存储路径
grafana 3000 /etc/grafana grafana配置文件
/var/lib/grafana grafana数据文件

部署步骤:
监控部署组件安装包已经集成在ansible中,以下主要介绍安装部署的使用方法:
1、进入monitor-init目录在target.yml文件中添加各个主机需要安装的角色:

在这里插入图片描述

2、接着定义变量值(路径monitor-init/vars/settings.yml)
在这里插入图片描述
需要修改的变量有:
alertmanager_info: alertmanager的ip和端口
blackbox_info: blackbox_exporter的ip和端口
alertmanager_email_smtp_from: 企业邮箱的账号
alertmanager_email_smtp_smarthost: 企业邮箱的smarthost(每个邮箱产品都会有自己的smar thost)
alertmanager_email_smtp_auth_username: 邮箱的账号
alertmanager_email_smtp_auth_password: 邮箱密码(不是邮箱登录密码,指的是邮箱开启smtp pop3的验证码)
alertmanager_receive_email_to:告警接收人的邮箱
alertmanager_receive_webhook_to: alertmanager webhook地址
3、修改完成后执行ansible-playbook -i target.yml main.yml即可。

二、配置命名规范与配置方法

部署完告警之后,下一步需要在prometheus配置文件中加入各个告警机器的信息。由于告警采用的是基于文件发现的服务机制,所以特定的文件配置着特定功能的exporter。配置规则如下:

1、node_exporter

配置路径: /data/monitor/dis/blackbox_dis.yml
配置命名规范:
targets:node_exporter的ip:port
tags:生产环境、测试环境或者开发环境
name: 组织或者产品(例如:”神仙道”,”运维”)name的主要作用是为了区分graf

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值