Prometheus容器监控指标详解

最新推荐文章于 2024-08-13 16:44:01 发布

仁王_雅治

最新推荐文章于 2024-08-13 16:44:01 发布

阅读量2.5k

点赞数

文章标签： prometheus metrics

本文链接：https://blog.csdn.net/weixin_38645718/article/details/86501381

版权

本文详细解析了Prometheus监控Kubernetes集群中的各种指标，包括CPU使用率的计算步骤、Pod健康状况检查、StatefulSet状态、Node相关指标以及Pod相关指标，提供了深入理解和监控容器环境的关键信息。

摘要由CSDN通过智能技术生成

CPU使用率

指标名称：container_cpu_usage_seconds_total
容器CPU使用率计算公式详解

注：container_cpu_usage_seconds_total得到的并不是容器的CPU使用率，待我们一层层分析。

第一步：

http://10.4.**.***:31263/api/v1/query?query=container_cpu_usage_seconds_total{image!="",container_name!="POD",namespace="default"}

注：命名空间default下有两个Pod，分别为Pod1和Pod2。

上面的表达式查询出两组数据，分别为pod_name="Pod1"和pod_name=“Pod2”。每组数据都包含一个值，没有时间戳，默认为当前时间。

第二步：

http://10.4.**.***:31263/api/v1/query_range?query=container_cpu_usage_seconds_total{image!="",container_name!="POD",namespace="default"}[30s]

注1：将调用的接口从query变为query_range。

注2：Prometheus配置文件中将采集周期定义为15s，这里的[30s]表示过去30s的所有值。此时Pod1和Pod2分别对应两组数据。每组数据中包含一个时间戳和一个该时间戳下的value值。同理，45s对应三组数据。

第三步：

http://10.4.**.***:31263/api/v1/query_range?query=rate(container_cpu_usage_seconds_total{image!="",container_name!="POD",namespace="default"}[1m])

注：对每组过去1分钟的数据做计算，此时Pod1和Pod2分别对应一组数据，rate将每组数据中多个时间戳对应的数据聚合起来。

第四步：

http://10.4.**.***:31263/api/v1/query_range?query=sum(rate(container_cpu_usage_seconds_total{image!="",container_name!="POD",namespace="default"}[1m]))

注：对两个Pod的数据进行聚合，此时一共只有一组数据。

第五步：

最低0.47元/天解锁文章

仁王_雅治

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录