目录
1.4 修改Prometheus服务器的配置文件 (静态配置发现)
3.1 在prometheus服务配置prometheus.yml文件
一、部署Prometheus
1、环境准备工作
服务器类型 | IP地址 | 组件 |
---|---|---|
Prometheus 服务器 | 192.168.100.20 | Prometheus、node_exporter |
grafana 服务器 | 192.168.100.30 | Grafana |
agent 服务器 | 192.168.100.40 | node_exporter |
2、普罗米修斯的部署
prometheus下载地址:
2.1 上传prometheus安装包并解压
mkdir /mnt/prometheus
cd /mnt/prometheus
上传安装包prometheus-2.39.1.linux-amd64.tar.gz
tar zxf prometheus-2.39.1.linux-amd64.tar.gz 解压
ls
mv prometheus-2.39.1.linux-amd64 /usr/local/prometheus 添加到环境中
ls /usr/local/prometheus/
2.2 修改配置文件
cd /usr/local/prometheus/
cp prometheus.yml prometheus.yml.bak 备份
cat /usr/local/prometheus/prometheus.yml | grep -v "^#"
global: #用于prometheus的全局配置,比如采集间隔,抓取超时时间等
scrape_interval: 15s #采集目标主机监控数据的时间间隔,默认为1m
evaluation_interval: 15s #触发告警生成alert的时间间隔,默认是1m
# scrape_timeout is set to the global default (10s).
scrape_timeout: 10s #数据采集超时时间,默认10s
alerting: #用于alertmanager实例的配置,支持静态配置和动态服务发现的机制
alertmanagers:
- static_configs:
- targets:
# - alertmanager:9093
rule_files: #用于加载告警规则相关的文件路径的配置,可以使用文件名通配机制
# - "first_rules.yml"
# - "second_rules.yml"
scrape_configs: #用于采集时序数据源的配置
# The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
- job_name: "prometheus" #每个被监控实例的集合用job_name命名,支持静态配置(static_configs)和动态服务发现的机制(*_sd_configs)
# metrics_path defaults to '/metrics'
# scheme defaults to 'http'.
static_configs: #静态目标配置,固定从某个target拉取数据
- targets: ["192.168.100.20:9090"]
2.3 配置系统启动文件,设置开机自启
第一种启动
vim /usr/lib/systemd/system/prometheus.service
[Unit] #服务单元
Description=Prometheus Server
Documentation=https://prometheus.io
After=network.target #依赖关系[Service]
Type=simple
ExecStart=/usr/local/prometheus/prometheus \
--config.file=/usr/local/prometheus/prometheus.yml \ #配置文件
--storage.tsdb.path=/usr/local/prometheus/data/ \ #数据目录
--storage.tsdb.retention=15d \ #保存时间
--web.enable-lifecycle #开机热加载ExecReload=/bin/kill -HUP $MAINPID #重载
Restart=on-failure
[Install]
WantedBy=multi-user.target
第二种启动
cd /usr/local/prometheus
./prometheus
2.4 开启prometheus,并访问网页验证
systemctl start prometheus
systemctl enable prometheus
netstat -natp | grep :9090
浏览器访问:http://192.168.100.20:9090 ,访问到 Prometheus 的 Web UI 界面
点击页面的 Status -> Targets,如看到 Target 状态都为 UP,说明 Prometheus 能正常采集到数据
http://192.168.100.20:9090/metrics ,可以看到 Prometheus 采集到自己的指标数据
通过 http:// 服务器 IP:9090/metrics 可以查看到监控的数据:
二、部署Exporters
1、远程监控linux主机
在远程 linux 主机(被监控端 agent)上安装 node_exporter 组件。
下载地址:
1.1 上传node_exporter安装包
cd /mnt
mkdir prometheus.node_exporter
cd prometheus.node_exporter/
上传安装包 node_exporter-1.4.0.linux-amd64.tar.gz
tar zxf node_exporter-1.4.0.linux-amd64.tar.gz 解压
cd node_exporter-1.4.0.linux-amd64/
ls
mv node_exporter /usr/local/bin/ 添加到环境
ls /usr/local/bin/
1.2 配置启动文件,设置开机自启
vim /usr/lib/systemd/system/node_exporter.service
[Unit]
Description=node_exporter
Documentation=https://prometheus.io/
After=network.t