## 指标统计语句
cpu: node_cpu_seconds_total
### 节点 1 分钟内的空闲 CPU 使用时间 除以 总的时间就是使用率
sum(increase(node_cpu_seconds_total{mode="idle"}[1m])) by (instance) / sum(increase(node_cpu_seconds_total[1m])) by (instance)
cpu使用率%:(1 - sum(rate(node_cpu_seconds_total{mode="idle"}[1m])) by (instance) / sum(rate(node_cpu_seconds_total[1m])) by (instance) ) * 100
内存总量:node_memory_Buffers_bytes + node_memory_Cached_bytes + node_memory_MemFree_bytes
内存使用率:(1- (node_memory_Buffers_bytes + node_memory_Cached_bytes + node_memory_MemFree_bytes) / node_memory_MemTotal_bytes) * 100
节点(ip)总内存:node_memory_MemTotal_bytes/1024/1024/1024 (单位G)
磁盘:node_filesystem_avail_bytes{fstype=~"ext4|xfs"} {fstype=~"ext4|xfs"} ext 、 xfs 文件格式,fstype 过滤
磁盘使用率:(1 - node_filesystem_avail_bytes{fstype=~"ext4|xfs"} / node_filesystem_size_bytes{fstype=~"ext4|xfs"}) * 100
磁盘IO: 写入统计 node_disk_writes_completed_total 读取统计 node_disk_reads_completed_total
磁盘读IO: sum by (instance) (rate(node_disk_reads_completed_total[5m]))
总计写入和读取相加:rate(node_disk_reads_completed_total[5m]) + rate(node_disk_writes_completed_total[5m])
## 网速
上行宽带 node_network_receive_bytes_total
上行宽带速率 sum by(instance) (irate(node_network_receive_bytes_total{device!~"bond.*?|lo"}[5m]))
下行宽带 node_network_transmit_bytes_total
下行宽带速率 sum by(instance) (irate(node_network_transmit_bytes{device!~"bond.*?|lo"}[5m]))
-------------------------------------------------------------------
-- ipAddress:所要查询的IP地址
### cpu占用率
100 -avg(irate(node_cpu_seconds_total{instance=\"ipAddress\",mode=\"idle\"}[5m])) by (instance)* 100
### 内存占用率
(node_memory_MemTotal_bytes{instance=\"ipAddress\"} - (node_memory_MemFree_bytes{instance=\"ipAddress\"} " +
"+ node_memory_Buffers_bytes{instance=\"ipAddress\"}+node_memory_Cached_bytes{instance=\"ipAddress\"} ))/node_memory_MemTotal_bytes{instance=\"ipAddress\"} * 100
### 磁盘占用率
100 - (node_filesystem_free_bytes{instance=\"ipAddress\",mountpoint=\"/\",fstype=~\"ext4|xfs\"} / node_filesystem_size_bytes{instance=\"ipAddress\",mountpoint=\"/\",fstype=~\"ext4|xfs\"} * 100)
### 磁盘读写速率
((rate(node_disk_read_bytes_total{instance=\"ipAddress\"}[1m]) + rate(node_disk_written_bytes_total{instance=\"ipAddress\"}[1m]))/(1024*1024)) > 0
### 网速
sum by(instance) ((irate(node_network_receive_bytes_total{instance=\"ipAddress\"}[5m]) + irate(node_network_transmit_bytes_total{instance=\"ipAddress\"}[5m]))/125000)
## 连接状态返回 1 是正常 0 是异常
### HTTP连接状态
probe_success{instance=\"ipAddress\", job=\"http_status\"}
### ssh连接状态
probe_success{instance=\"ipAddress\", job=\"ssh_status\"}
### tcp连接状态
probe_success{instance=\"ipAddress\", job=\"tcp_status\"}
Prometheus 实践操作 -> 常用统计指标PQL
最新推荐文章于 2024-05-16 22:50:09 发布