【PromQL 快速入门】从零掌握 Prometheus 指标查询

原创已于 2025-07-11 11:08:19 修改 · 435 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-07-01 10:38:49 首次发布

12 篇文章

订阅专栏

最近在项目中接触了 Prometheus + Grafana 监控体系，发现 PromQL（Prometheus Query Language） 是分析监控数据的核心工具。作为初学者，我整理了这份学习笔记，希望能帮助其他同学快速上手！

PromQL 是 Prometheus 专用的查询语言，用于：

指标是监控数据的名称，表示被测量的系统属性（如 http_requests_total）。

类型	特点	示例
Counter	只增不减（如请求总数）	`http_requests_total`
Gauge	可增可减（如内存占用）	`node_memory_free`
Histogram	统计数据分布（如延迟分桶）	`request_latency_seconds_bucket`

标签是键值对，用于细分指标维度（如按服务、实例、状态码过滤）。

示例：

http_requests_total{method="GET", status="200", instance="10.0.0.1:8080"}

按标签过滤：

http_requests_total{status!="200"}  // 非200请求

函数	作用	示例
`rate()`	计算计数器增长率	`rate(http_requests_total[5m])`
`sum()`	求和	`sum(api_errors) by (service)`
`histogram_quantile()`	计算百分位数（P99）	`histogram_quantile(0.99, latency_bucket)`

100 - (avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

sum(rate(http_requests_total{status=~"5.."}[5m])) / sum(rate(http_requests_total[5m]))

PromQL 的核心是：

下一步行动：