kubernetes-监控系统Prometheus

最新推荐文章于 2024-07-07 16:48:42 发布

Sxm&

最新推荐文章于 2024-07-07 16:48:42 发布

阅读量1k

点赞数 22

本文链接：https://blog.csdn.net/xianmingsu/article/details/135180634

版权

云原生专栏收录该内容

18 篇文章 2 订阅

订阅专栏

本文介绍了在微服务环境中监控系统的重要性，特别是Kubernetes集群监控系统，如Prometheus的使用。详细讲解了Prometheus的指标类型、应用如何上报指标、原生暴露的Prometheus指标（如cAdvisor和NodeExporter）以及服务发现和relabel规则的应用。

摘要由CSDN通过智能技术生成

一、概述

在微服务分布式系统中，监控是极其重要的。监控能够对系统的运行状态了如指掌，有问题及时发现。

监控的目的：

长期预测分析：比如资源用量预测。
告警：当系统出现或者即将出现故障时，监控系统迅速反应并通知管理员。
故障分析与定位：通过监控以及历史数据分析，能够找到根源问题。
数据可视化：通过可视化仪表盘能够直接获取系统的运行状态、资源使用情况以及服务运行状态等直观信息。

二、kubernetes集群监控系统

在这里插入图片描述

基于HTTP协议的Pull模式进行时间序列指标采集。
以指标名称和键值对标签唯一标识的基于时间序列的数据模型。
支持多维灵活查询的PromQL。
灵活的图形化展示。
基于静态配置或服务发现的目标发现机制。

三、Prometheus指标类型

Counter（计数器器）
- Counter类型代表一种样本数据单调递增的指标，即只增不减，除非监控系统发生了重置。
Gauge（仪表盘）
- Guage 类型代表一种样本数据可以任意变化的指标，即可增可减。
Histogram（直方图）
- Histogram在一段时间范围内对数据进行采样（通常是请求持续时间或响应大小等），并将其计入可配置的存储桶（bucket）中，后续可通过指定区间筛选样本，也可以统计样本总数，最后一般将数据展示为直方图。

四、应用上报指标

apiVersion: apps/v1
kind: Deployment
metadata:
  name: httpserver-metrics-deploy
  labels: 
    app: httpserver-metrics
  namespace: default
spec:
  selector:
    matchLabels:
      app: httpserver-metrics
  replicas: 1
  template:  
    metadata:
      labels:
        app: httpserver-metrics
      #增加注解
      annotations:
        prometheus.io/port: "80"
        prometheus.io/scrape: "true"
    spec:
      containers:
      - name: httpserver
        image: httpserver-metrics:v1.0
        ports:
        - containerPort: 80

pod需要显示的增加annotations：prometheus.io/port和prometheus.io/scrape，这样Prometheus才会收集这个pod的指标。默认情况下，应用往/metrics暴露指标即可，Prometheus会从应用的/metrics收集指标。若应用有特定的指标暴露路径，那么Prometheus的配置文件指定自定义指标路径。

五、kubernetes原生暴露Prometheus指标

在这里插入图片描述
之所以说Prometheus是云原生的监控标准，因为kubernetes的很多组件都原生的暴露Prometheus 格式的 metrics。所以Prometheus很容易就收集到这些指标。

5.1 cAdvisor

cAdvisor (Container Advisor) 是一个用于监控和收集容器资源使用情况的开源工具。cAdvisor 默认会收集以下几个主要的容器指标：

CPU：包括容器的 CPU 使用率、限制和限制的时间窗口等信息。
内存：包括容器的内存使用情况、限制和 Swap 使用情况等。
文件系统：包括容器的文件系统使用情况和磁盘 I/O 指标。
网络：包括容器的网络 I/O 指标，例如接收和发送的字节数。
负载：包括容器的负载平均值、运行线程数量等。
进程：包括容器内部的进程数和进程状态等信息。

每个节点的kubelet集成了cAdvisor ，Prometheus 会 pull 这些信息，给每个节点打上标签来区分不同的节点。
在这里插入图片描述
例如cAdvisor其中一个监控指标container_cpu_usage_seconds_total(容器在每个CPU内核上的累积占用时间 (单位：秒))，上报了每个pod容器的这个指标。

5.2 Node Exporter

Node Exporter 是prometheus官方提供的agent，用于收集主机的硬件和操作系统指标。
在这里插入图片描述
例如node_cpu_seconds_total，它代表CPU每种模式下花费的时间，是counter型的，会随着时间一直增长。其标签，cpu表示第几个核，instance表node_exporter所在机器，job表示来自prometheus配置的哪个任务，mode表示这是cpu处于哪种模式。