prometheus 告警规则

本文详细介绍了如何在Prometheus中设置告警规则,包括定义告警条件、配置通知渠道和管理告警状态。通过实例解析,展示了如何利用PromQL进行复杂监控指标的筛选和组合,确保在系统出现异常时能够及时发出预警。
摘要由CSDN通过智能技术生成
[root@k8s-master1 promethes]# cat prometheus-rules.yaml 
apiVersion: v1
kind: ConfigMap
metadata:
  name: prometheus-rules
  namespace: kube-system
data:
  general.rules: |
    groups:
    - name: general.rules
      rules:
      - alert: InstanceDown
        expr: up == 0
        for: 1m
        labels:
          severity: error 
        annotations:
          summary: "Instance {
  { $labels.instance }} 停止工作"
          description: "{
  { $labels.instance }} job {
  { $labels.job }} 已经停止5分钟以上."
          
  node.rules: |
    groups:
    - name: node.rules
      rules:
      - alert: NodeFilesystemUsage
        expr: |
          node_filesystem_avail{fstype=~"ext.|xfs",job="kubernetes-service-endpoints"}
          / node_filesystem_size{fstype=~"ext.|xfs",job="kubernetes-service-endpoints"}
          * 100 <= 10 
        for: 2m
        labels:
          severity: critical 
   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值