Kubernetes 监控管理

最新推荐文章于 2024-06-05 17:54:08 发布

lzyever

最新推荐文章于 2024-06-05 17:54:08 发布

阅读量693

点赞数 27

分类专栏： Kubernetes(K8S) 文章标签： kubernetes

本文链接：https://blog.csdn.net/lzyever/article/details/138684420

版权

Kubernetes(K8S) 专栏收录该内容

63 篇文章 2 订阅

订阅专栏

1. Metrics Server

作用：Metrics Server 是 Kubernetes 集群的默认资源度量标准，提供Pods和Nodes的基本资源使用情况（如CPU和内存）。

安装与配置：

kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

使用：Metrics Server 的数据可用于HPA（Horizontal Pod Autoscaler）自动扩展Pod，或者通过kubectl top命令查看资源使用情况。

2. Prometheus & Grafana

Prometheus：一个强大的开源监控系统，擅长收集和存储时间序列数据。
Grafana：可视化工具，常与Prometheus搭配使用，提供图表展示和报警功能。

部署：使用Helm chart或直接应用YAML文件部署Prometheus和Grafana。

示例（Helm安装PrometheusOperator）：

helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm install prometheus prometheus-community/prometheus-operator

3. cAdvisor

内置监控：每个Kubernetes节点上运行的cAdvisor自动收集节点及容器的资源使用情况（CPU、内存、文件系统、网络）。
使用：cAdvisor数据可通过Prometheus等工具进一步采集和展示。

4. 日志收集

Fluentd / Fluent Bit：常用于Kubernetes集群的日志收集，将容器日志转发到Elasticsearch、Logstash或直接到存储系统。
Elastic Stack（ELK Stack）：包括Elasticsearch（存储和索引）、Logstash（日志处理）和Kibana（可视化），是处理和分析日志的流行组合。

部署示例（使用Fluentd DaemonSet）：

apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: fluentd
spec:
  selector:
    matchLabels:
      name: fluentd
  template:
    metadata:
      labels:
        name: fluentd
    spec:
      containers:
      - name: fluentd
        image: fluent/fluentd-kubernetes-daemonset:v1.14-debian-elasticsearch
        volumeMounts:
        - name: varlog
          mountPath: /var/log
        - name: varlibdockercontainers
          mountPath: /var/lib/docker/containers
          readOnly: true
      volumes:
      - name: varlog
        hostPath:
          path: /var/log
      - name: varlibdockercontainers
        hostPath:
          path: /var/lib/docker/containers

5. 告警与通知

Alertmanager（与Prometheus配合使用）：负责处理警报，分组、去重，并将警报发送到正确的接收器（邮件、Slack等）。

配置示例（在Prometheus规则文件中定义警报规则）：

groups:
- name: ExampleGroup
  rules:
  - alert: HighMemoryUsage
    expr: sum(container_memory_usage_bytes{namespace="default"}) by (pod) > 1e+09
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "High Memory Usage on {{ $labels.pod }}"
      description: "Pod {{ $labels.pod }} in namespace {{ $labels.namespace }} has been using more than 1GB of memory."