简介
本监控使用的doris版本是1.2.0
相关资料
链接:https://pan.baidu.com/s/1yWCjootaPSfHsbRiiabq0w
提取码:4sad
--来自百度网盘超级会员V5的分享
操作
1.检查指标是否启动(默认开启的)
Frontend: fe_host:fe_http_port/metrics
Backend: be_host:be_web_server_port/metrics
curl http://localhost:8081/metrics
curl http://localhost:8040/metrics
打印如下
doris_be_cpu{device="cpu1",mode="system"} 2048972
doris_be_cpu{device="cpu0",mode="system"} 2080255
doris_be_cpu{device="cpu",mode="idle"} 1775135302
doris_be_cpu{device="cpu1",mode="idle"} 876824953
doris_be_cpu{device="cpu0",mode="idle"} 898310348
doris_be_cpu{device="cpu",mode="iowait"} 634839
doris_be_cpu{device="cpu1",mode="iowait"} 201298
doris_be_cpu{device="cpu0",mode="iowait"} 433540
doris_be_cpu{device="cpu",mode="irq"} 0
doris_be_cpu{device="cpu1",mode="irq"} 0
doris_be_cpu{device="cpu0",mode="irq"} 0
doris_be_cpu{device="cpu",mode="soft_irq"} 134381
doris_be_cpu{device="cpu1",mode="soft_irq"} 69974
doris_be_cpu{device="cpu0",mode="soft_irq"} 64406
doris_be_cpu{device="cpu",mode="steal"} 0
doris_be_cpu{device="cpu1",mode="steal"} 0
doris_be_cpu{device="cpu0",mode="steal"} 0
doris_be_cpu{device="cpu",mode="guest"} 0
doris_be_cpu{device="cpu1",mode="guest"} 0
doris_be_cpu{device="cpu0",mode="guest"} 0
doris_be_cpu{device="cpu",mode="guest_nice"} 0
doris_be_cpu{device="cpu1",mode="guest_nice"} 0
doris_be_cpu{device="cpu0",mode="guest_nice"} 0
# TYPE doris_be_query_cache_partition_total_count gauge
doris_be_query_cache_partition_total_count 0
# TYPE doris_be_s3_file_writer_total counter
doris_be_s3_file_writer_total 0
# TYPE doris_be_file_created_total counter
doris_be_file_created_total 0
# TYPE doris_be_local_bytes_read_total counter
doris_be_local_bytes_read_total 0
# TYPE doris_be_process_fd_num_limit_soft gauge
doris_be_process_fd_num_limit_soft 65535
2.监控开启和关闭的小技巧。
#关闭prometheus
curl -X POST http://localhost:9090/-/quit
#开启上面使用http关闭的功能
nohup ./prometheus --web.enable-lifecycle --config.file=prometheus.yml > ./prometheus.log 2>&1 &
3.修改prometheus配置文件。
vi prometheus.yml
scrape_configs:
# The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
- job_name: 'PALO_CLUSTER' # 每一个 Doris 集群,我们称为一个 job。这里可以给 job 取一个名字,作为 Doris 集群在监控系统中的名字。
metrics_path: '/metrics' # 这里指定获取监控项的 restful api。配合下面的 targets 中的 host:port,Prometheus 最终会通过 host:port/metrics_path 来采集监控项。
static_configs: # 这里开始分别配置 FE 和 BE 的目标地址。所有的 FE 和 BE 都分别写入各自的 group 中。
- targets: ['feip:8081']
labels:
group: fe # 这里配置了 fe 的 group,该 group 中包含了 3 个 Frontends
- targets: ['beip:8040', 'beip:8040']
labels:
group: be # 这里配置了 be 的 group,该 group 中包含了 3 个 Backends
4.重启prometheus。
#可以先测试下有没有错误
./prometheus --web.enable-lifecycle --config.file=prometheus.yml
#如果没有错误则按下面的情况启动
nohup ./prometheus --web.enable-lifecycle --config.file=prometheus.yml > ./prometheus.log 2>&1 &
5.登录Grafana导入官方监控文件。
相关doris监控指标介绍