prometheus告警规则_node_exporter rule

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

summary: “监控数据获取异常”
description: “{{ $labels.instance }} 主机可能宕机,所在节点 Master 私网IP {{ $labels.master_private_ip }} ;如果是已下线机器则忽略”

  • alert: InstanceReboot
    expr: (node_time_seconds-node_boot_time_seconds) < 600
    labels:
    severity: info
    annotations:
    summary: “新启动”
    description: “{{ $labels.instance }} 新启动”
    value: “{{ $value }}”

  • alert: CPU
    expr: round(100 - (avg(irate(node_cpu_seconds_total{mode=“idle”}[5m])) by (instance,job) * 100),0.01) > 96
    for: 7m
    labels:
    severity: critical
    annotations:
    summary: “CPU 使用率很高”
    description: “{{ $labels.instance }} CPU 使用率 {{ $value }}%”
    value: “{{ $value }}”

  • alert: LOAD
    expr: node_load5 / on (instance) sum(count(node_cpu_seconds_total{mode=‘system’}) by (cpu,instance)) by(instance) > 7
    for: 7m
    labels:
    severity: critical
    annotations:
    summary: “overload”
    description: “{{ $labels.instance }} 负载/CPU核数比 {{ $value }}”
    value: “{{ $value }}”

  • alert: MEM
    expr: round((1 - ((node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) or ((node_memory_MemFree_bytes + node_memory_Buffers_bytes + node_memory_Cached_bytes) / node_memory_MemTotal_bytes))) * 100,0.01) > 96
    for: 10m
    labels:
    severity: critical
    annotations:
    summary: “闪存不足”
    description: “{{ $labels.instance }} MEM 使用占比 {{ $value }}%”
    value: “{{ $value }}”

  • alert: DISK
    expr: round((100-(node_filesystem_avail_bytes{mountpoint!=‘/boot’,fstype=‘ext.+|ocfs.+|xfs’}/node_filesystem_size_bytes{mountpoint!=‘/boot’,fstype=‘ext.+|ocfs.+|xfs’})*100 > 90 and node_filesystem_avail_bytes{mountpoint!=‘/boot’,fstype=~‘ext.+|ocfs.+|xfs’}/1073741824 < 10),0.01)
    for: 28m
    labels:
    severity: info
    annotations:
    summary: “存储空间不足”
    description: “{{ $labels.instance }} {{ $labels.mountpoint }} 存储空间使用占比 {{ $value }}%”
    value: “{{ $value }}”

  • alert: IOWAIT
    expr: round((avg by (instance,job) (irate(node_cpu_seconds_total{mode=“iowait”}[3m])) * 100),0.01) > 80
    for: 7m
    labels:
    severity: info
    annotations:
    summary: “CPU iowait 过高”
    description: “{{ $labels.instance }} CPU iowait {{ $value }}%”
    value: “{{ $value }}”

  • alert: IO
    expr: round(100-(avg(irate(node_disk_io_time_seconds_total[3m])) by(instance,job)* 100),0.01) < 60
    for: 7m
    labels:
    severity: info
    annotations:
    summary: “磁盘 I/O 性能低”
    description: “{{ $labels.instance }} {{ $labels.mountpoint }} 磁盘 I/O 时间占比 {{ $value }}%”
    value: “{{ $value }}”

  • alert: ProcessNearFDLimits
    expr: process_open_fds / process_max_fds > 0.8
    for: 3m
    labels:
    severity: critical
    annotations:
    summary: “A process hits 80% of the limit”
    description: “{{ $labels.instance }} 进程使用的文件描述符数占比 {{ $value }}”
    value: “{{ $value }}”

  • alert: TCP_ESTAB
    expr: node_netstat_Tcp_CurrEstab > 20000
    for: 3m
    labels:
    severity: info
    annotations:
    summary: “TCP 会话数很多”
    description: “{{ $labels.instance }} TCP_ESTABLISHED {{ $value }}”
    value: “{{ $value }}”

  • alert: Processes_Blocked
    expr: node_procs_blocked / on(instance) sum by(instance) (count by(cpu, instance) (node_cpu_seconds_total{mode=“system”})) > 2
    for: 3m
    labels:
    severity: critical
    annotations:
    summary: “任务阻塞”
    description: “{{ $labels.instance }} 当前被阻塞的任务数/CPU核数比 {{ $value }}”
    value: “{{ $value }}”

最后的话

最近很多小伙伴找我要Linux学习资料,于是我翻箱倒柜,整理了一些优质资源,涵盖视频、电子书、PPT等共享给大家!

资料预览

给大家整理的视频资料:

给大家整理的电子书资料:

如果本文对你有帮助,欢迎点赞、收藏、转发给朋友,让我有持续创作的动力!

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

s.csdn.net/topics/618635766)**

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 24
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值