架构
Kubenurse 是一个小服务,用于监控 Kubernetes 集群中的所有网络连接。 Kubenurse 测量请求持续时间、记录错误并以 Prometheus 格式导出这些指标。
以下是 kubenurse 执行的检查的概述,这些检查作为各种持续时间/错误 prometheus 指标的标签公开。
指标
所有执行的检查都会公开可用于监视/警报的指标:
- 节点到节点的网络延迟和错误
- Pod 到 apiserver 通信
- 入口往返延迟和错误
- 服务往返延迟和错误(kube-proxy / 您的 CNI)
- 主要 kube-apiserver 问题
- kube-dns(或 CoreDNS)错误
- 外部 DNS 解析错误(入口 URL 解析)
https://github.com/postfinance/kubenurse