prometheus的label丢失问题

引言

工作许久,每日忙于各种事务,因为很少进行总结和回顾,导致知识面和技能不够体系化。期望能通过记录日常问题排查,技术学习的点点滴滴,来帮助自己体系化的构筑自己的知识仓库,同时,如果能帮助到他人,也是一件令人开心的事。

正文

问题

        有同事反馈在所有Kubernetes配置都一样的情况下,镜像不同,grafana中(数据源是prometheus)查看pod的指标container_cpu_usage_seconds_total,会出现label不一致的情况,有一个pod多了一些没见过的label,缺少了一些基本label。

排查过程

        按本人理解,prometheus的metric采集可以分为指标生成、指标上报、指标处理三个阶段,所以按这个顺序进行排查。

        因为container_cpu_usage_seconds_total是cadvisor的指标,而kubelet是负责初始化的,所以查看kubelet的代码:

 

        看到函数NewPrometheusCollector,那可以继续追踪这个函数

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值