prometheus监控VShereClient7.0_EXSi7.0主机状态

 

prometheus监控VShereClient7.0_EXSi7.0主机状态这篇文章就够了,网上一些菜鸡那文章简直辣眼睛,就是瞎几把炒文章。

我用的docker的方式监控的,方便不需要编译。我监控的是:

VShereClient7.0_EXSi7.0主机状态

VShereClient7.0_EXSi7.0主机状态

VShereClient7.0_EXSi7.0主机状态

重要的事情说三遍。下面贴一张监控展示图,下面开始部署。

前提是把单台的EXSi7.0通过VShereClient7.0组成集群,vmware_exporter采集的数据是VShereClient7.0的数据,如下图。注意!!!!

第一步、编写docker-compose

[root@monitor vmware_exporter]# ls
docker-compose.yaml
[root@monitor vmware_exporter]# cat docker-compose.yaml
services:
  vmware-exporter:
    image: pryorda/vmware_exporter:v0.11.1
    container_name: vmware-exporter
    restart: unless-stopped
    ports:
       - '9272:9272'
    expose:
       - 9272
    environment:
      VSPHERE_HOST: "10.0.10.210"
      VSPHERE_IGNORE_SSL: "True"
      VSPHERE_USER: "administrator@vsphere.local"
      VSPHERE_PASSWORD: "1qazXSW@"
    labels:
      org.label-schema.group: "monitoring"

第二、使用docker-compose将容器运行起来。

使用docker-compose将该容器运维起来。docker ps 查询该容器是否运行起来。如果没有请自行排查原因。

docker-compose up -d

第三、浏览该问监控所在服务器的ip+端口。

访问ip+端口发现vmware_exporter可以正常采集到数据,说明这就成功了80%了,剩下的就是配置监控项报警规则。

第四、配置监控项报警规则

添加监控项,并浏览器查看,满足监控规则就会报警。报警途径有许多请自行设置。

[root@monitor rules]# cat VsphereAlert.yml
groups:
    - name: EXSi主机状态监控告警
      rules:
      - alert: EXSi主机状态
        expr: vmware_host_power_state ==0
        for: 5m
        labels:
          type: lost
          severity: fatal
        annotations:
          summary: "EXSi主机 {{$labels.host_name}} 失联"
          description: "EXSi任务 {{$labels.job}} 下的主机 {{$labels.host_name}} 已经超过五分钟没有数据了."
          monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

      - alert: EXSi主机CPU使用情况
        expr: (vmware_host_cpu_usage / vmware_host_cpu_max) * 100 >80
        for: 5m
        labels:
          type: cpu
          severity: warning
        annotations:
          summary: "EXSi主机 {{ $labels.host_name }} 的 CPU 使用率告警"
          description: "EXSi主机 {{ $labels.host_name }} CPU 使用率超过 80%, 当前值为: {{ $value }}"
          monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

      - alert: EXSi主机内存使用
        expr: (vmware_host_memory_usage/ vmware_host_memory_max) * 100 >85
        for: 5m
        labels:
          type: mem
          severity: warning
        annotations:
          summary: "EXSi主机 {{ $labels.host_name }} 的内存使用率告警"
          description: "EXSi主机 {{ $labels.host_name }} 的内存使用率超过 85%, 当前值为: {{ $value }}"
          monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

      - alert: EXSi主机磁盘容量
        expr: ((vmware_datastore_capacity_size- vmware_datastore_freespace_size) / vmware_datastore_capacity_size) * 100  >70
        for: 5m
        labels:
          type: cpu
          severity: warning
        annotations:
          summary: "EXSi主机 {{ $labels.host_name }} 的磁盘使用率告警"
          description: "EXSi主机 {{ $labels.host_name }} 的磁盘使用率超过 70%, 挂载点: {{ $labels.mountpoint }} 当前值为:{{ $value }}%"
          monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

第五、添加Grafana展示模板。

请自行添加模板(连接地址https://grafana.com/grafana/dashboards/11243)模板ID:11243,添加时模板数据源选择promethus。最终展示如下图。

这是报警截图。

 

感谢大家不足之处请指出,谢谢。

 

  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值