上一篇主要概述了监控思路和客户体验监控,这篇侧重于基础设施监控。
监控方法方面,可以细分为:
1. 服务/业务通断(可用性) 。2. 使用量3. 吞吐量4. 容量
以上4类并非严格区分,仅用于参考,新应用/服务监控时会从这几方面考虑。
基础设施可用性(通断)一般通过简单ping都可以发现,至于使用量和吞吐量,以及容量,那就属于过程监控了,基本上必须依赖专业的监控工具来做了。这里列举了些典型的监控指标:
主机监控:CPU使用率30%,内存使用率30%,磁盘读写1MBps,网络10Kbps,为什么机器就是慢?主流公云监控给的数据大众化了,基本上这些指标没有任何意义,对监控分析没有一毛钱帮助。