阿里云提供的主机监控项有两类:1. 操作系统监控项;2. 基础监控项。其中,操作系统监控项数据采集频率为每15s一次;基础监控项采集频率为每1min一次。
操作系统监控项
CPU相关监控项
- cpu.idle:当前空闲CPU百分比。当前CPU处于空闲状态的百分比
- cpu.system:当前内核空间占用CPU百分比。系统上下文切换的消耗。若该监控项数值比较高,则说明服务器开了太多的进程或线程
- cpu.user:当前用户空间占用CPU百分比。用户进程对CPU的消耗
- cpu.wait:当前等待IO操作的CPU百分比。若该监控项数值比较高,则说明IO操作频繁
- cpu.other:其他占用CPU百分比。
- cpu.total:当前消耗的总CPU百分比。cpu.total = 1 - Host.cpu.idle
内存相关监控项
- memory.total.space:内存总量
- memory.free.space:剩余内存量
- memory.used.space:已用内存量
- memory.actualused.space:用户实际使用的内存
- memory.free.utilization:剩余内存百分比
- memory.used.utilization:内存使用率
系统平均负载监控项(监控项数值越大表示系统越繁忙)
- load.1m:过去1分钟的系统平均负载
- load.5m:过去5分钟的系统平均负载
- load.15m:过去15分钟的系统平均负载
- load.1m.percore:CPU平均每核过去1分钟的系统平均负载
- load.5m.percore:CPU平均每核过去5分钟的系统平均负载
- load.15m.percore:CPU平均每核过去15分钟的系统平均负载
磁盘相关监控项
- disk.usage.used_device:磁盘的已用存储空间
- disk.usage.utilization_device:磁盘使用率
- disk.usage.free_device:普通用户和超级用户的磁盘剩余存储空间
- disk.usage.avail_device:普通用户的磁盘剩余存储空间
- disk.usage.total_device:磁盘存储总量
- disk.read.bps_device:磁盘每秒读取的字节数
- disk.write.bps_device:磁盘每秒写入的字节数
- disk.read.iops_device:磁盘每秒的读请求数量
- disk.write.iops_device:磁盘每秒的写请求数量
文件系统监控项
- fs.inode.utilization_device:inode使用率。Linux系统内部不使用文件名,而使用inode号码来识别文件。当磁盘未存满,但inode已经分配完时,会出现无法再磁盘新建文件的情况,因此需要监控inode使用率。inode数量代表文件系统的文件数量,大量小文件会导致inode使用率过高
网络相关监控项
- network.in.rate_device:网卡每秒接收的比特数,即网卡的下行带宽
- network.out.rate_device:网卡每秒发送的比特数,即网卡的上行带宽
- network.in.packages_device:网卡每秒接收的数据包数
- network.out.packages_device:网卡每秒发送的数据包数
- network.in.errorpackages_device:设备驱动器检测到的接收错误包的数量
- network.out.errorpackages_device:设备驱动器检测到的发送错误包的数量
- network.tcp.connection_state:各种状态下的TCP连接数
进程相关监控项
- process.cpu_pid:某个进程消耗的CPU百分比
- process.memory_pid:某个进程消耗的内存百分比
- process.openfile_pid:当前进程打开文件数
- process.count_processname:指定关键字的进程数
基础监控项
- CPU使用率
- 经典网络公网流入带宽:公网入流量平均速率
- 内网流入带宽:私网入流量平均速率
- 经典网络公网流出带宽:公网出流量平均速率
- 内网流出带宽:私网出流量平均速率
- 所有磁盘读取BPS:系统磁盘每秒读取字节总数
- 所有磁盘写入BPS:系统磁盘每秒写入字节总数
- 所有磁盘每秒读取次数
- 所有磁盘每秒写入次数
- IP维度公网流入带宽
- IP维度公网流出带宽
- IP维度公网流出带宽使用率
- 经典网络公网流入流量
- 经典网络公网流出流量
- 内网流入带宽