1、CPU 指标:
container_cpu_load_average_10s:过去 10 秒容器 CPU 的平均负载 。
container_cpu_usage_seconds_total:容器在每个 CPU 内核上的累积占用时间(单位:秒)。
container_cpu_system_seconds_total:系统 CPU 累积占用时间(单位:秒)。
container_cpu_user_seconds_total:用户 CPU 累积占用时间(单位:秒)。
2、内存指标:
container_memory_max_usage_bytes:容器的最大内存使用量(单位:字节)。
container_memory_usage_bytes:容器当前的内存使用量(单位:字节)。
container_spec_memory_limit_bytes:容器的内存使用量限制。
3、文件系统指标:
container_fs_usage_bytes:容器中文件系统的使用量(单位:字节)。
container_fs_limit_bytes:容器可以使用的文件系统总量(单位:字节)。
container_fs_reads_bytes_total:容器累积读取数据的总量(单位:字节)。
container_fs_writes_bytes_total:容器累积写入数据的总量(单位:字节)。
4、网络指标:
container_network_receive_bytes_total:容器网络累积接收数据总量(单位:字节)。
container_network_transmit_bytes_total:容器网络累积传输数据总量(单位:字节)。
记录:
服务器k8s部署Cadvisor,同一份部署文件,部署多台服务器,有一台服务器访问失败,prometheus集群无法采集(未解决)
可能是权限问题,查看部署是否为特权模式
securityContext:
privileged: true