Prometheus的监控ESXI、虚拟机、vsan存储的告警规则

groups:
- name: VMware_Monitoring
  rules:
 
  # 主机CPU使用率告警
  - alert: 主机CPU使用率过高
    expr: ((vmware_host_cpu_usage / vmware_host_cpu_max) * 100) > 85
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: ({{ $labels.host_name }})CPU使用率超过85%
      description: "{{ $labels.instance }} 的主机 {{ $labels.host_name }} CPU使用率为{{ $value | printf \"%.2f\" }}%"
 
  # 主机内存使用率告警
  - alert: 主机内存使用率过高
    expr: ((vmware_host_memory_usage / vmware_host_memory_max) * 100) > 85
    for: 1s
    labels:
      severity: warning
    annotations:
      summary: ({{ $labels.host_name }})内存使用率超过75%
      description: "{{ $labels.instance }}的主机 {{ $labels.host_name }} 内存使用率为{{ $value | printf \"%.2f\" }}%"
 
  # 虚拟机快照快照数量多模板
  - alert:  虚拟机快照快照数量多模板
    expr: vmware_vm_snapshots > 5
    for: 1s
    labels:
      severity: warning
    annotations:
      summary: "虚拟机快照数量过多"
      description: "{{ $labels.instance }}中虚拟机={{ $labels.vm_name }}快照数量为:{{ $value }}个"
  
  #datestore使用率超90%
  - alert: datestore使用率超90%
    expr: ((1-(vmware_datastore_freespace_size / vmware_datastore_capacity_size) )*100)> 90
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: ({{ $labels.ds_name }}) 存储使用率超过70%
      description: "{{ $labels.instance }} 的 {{ $labels.ds_name }} 存储使用率为{{ $value | printf \"%.2f\" }}%"

  # 虚拟机CPU使用率告警
  - alert: 虚拟机CPU使用率过高
    expr: vmware_vm_cpu_usage_average/ 100 >= 90
    for: 1s
    labels:
      severity: error
    annotations:
      summary: 虚拟机({{ $labels.vm_name }})CPU使用率超90%
      description: "{{ $labels.instance }}中虚拟机{{ $labels.vm_name }} CPU使用率为{{ $value | printf \"%.2f\" }}%"
 
  # 虚拟机内存使用率告警
  - alert: 虚拟机内存使用率过高
    expr: vmware_vm_mem_usage_average / 100 >= 90
    for: 1s
    labels:
      severity: error
    annotations:
      summary: 虚拟机{{ $labels.vm_name }}内存使用率超90%
      description: "{{ $labels.instance }}中虚拟机={{ $labels.vm_name }} 内存使用率为{{ $value | printf \"%.2f\" }}%"
       
 
  # 虚拟机磁盘使用率告警
  - alert: 虚拟机磁盘使用率超90%
    expr: ((1-(vmware_vm_guest_disk_free / vmware_vm_guest_disk_capacity)) * 100) >=90
    for: 1s
    labels:
      severity: error
    annotations:
      summary: 虚拟机({{ $labels.vm_name }}) 磁盘使用率超过90%
      description: "{{ $labels.instance }} 的 {{ $labels.vm_name }} 路径为 {{ $labels.partition}} 磁盘使用率 {{ $value | printf \"%.2f\" }}%"
 

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
根据引用的内容,Elasticsearch_exporter_rules.yml是用来配置Elasticsearch集群告警规则的文件。这些规则是用来监控Elasticsearch服务的各种指标,并在满足某些条件时触发告警。具体的规则内容可以在该文件中找到。 另外,引用和引用提到了一些关于Prometheus监控服务的常见告警规则,其中也包括了Elasticsearch的监控规则。通过配置这些规则,可以监控Elasticsearch的各项指标,例如节点状态、文档数量、查询性能等,并在出现异常情况时及时发出告警通知。 综上所述,要了解更多关于Prometheus监控Elasticsearch的告警规则,可以参考Elasticsearch_exporter_rules.yml文件以及其他相关的监控规则配置文件。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [三、Prometheus常用告警规则rules.yml](https://blog.csdn.net/yeqinghanwu/article/details/126367493)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [prometheus 监控es规则](https://download.csdn.net/download/guleng90/80981220)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值