常用监控维度与指标总结

本文详细概述了从业务、前端、应用、系统、网络到安全等多维度的IT监控关键要素和指标,包括业务KPI、用户行为、性能指标、系统健康检查等,旨在帮助读者建立有效的监控体系。
摘要由CSDN通过智能技术生成

开源可观测性平台Signoz(三)【服务器主机监控篇】_轻量化监控工具

转载说明:如果您喜欢这篇文章并打算转载它,请私信作者取得授权。感谢您喜爱本文,请文明转载,谢谢。


《线上监控怎么做?》《做好监控告警的关键技巧》两篇文章中我们探讨了做好监控的一些陷阱和重要技巧。

本文则主要梳理了从不同维度做监控时,值得重点关注的监控要素/指标。

如下表:

监控维度重点关注监控要素/指标
业务监控

根据业务类型,列出业务关键KPI,从业务KPI寻找业务监控的重点。并将业务KPI与技术指标绑定,做好业务监控。

如客户满意度、客户成本、客户流失率等

前端监控

监控方式:

1. 真实用户监控:使用实际的用户流量作为监控数据,是前端监控工作的核心

2. 合成监控结合:创建假请求来生成数据做监控

指标:

    PV/UV/用户在每个页面的停留时间

    页面加载时间

    响应时间

    错误指标(js错误、promise错误、资源加载错误、接口错误、白屏等)

应用程序监控

1. CI/CD监控:持续构建时间、构建部署频率、测试通过率等指标

2. 端点监控(如:/health端点):内存使用、HTTP请求统计、外部资源指标等指标
3. 链路监控:请求量、响应异常、接口RT值、调用耗时等指标
4. 日志监控:HTTP响应、错误日志监控、数据库慢查询、其余业务指标

SSL证书监控证书到期时间
标准服务器系统监控1. CPU使用率
2. 内存使用率
3. 网络吞吐率
4. 磁盘使用率、磁盘IOPS
5. 负载(5min/15min)
web服务器监控1. 每秒请求数(req/sec)
2. HTTP状态码
3. 请求数(请求数≠连接数)
4. 请求时间
数据库服务器监控

1. CPU

2. 连接数(最大连接数、已创建的总连接数、已连接的连接数、当前缓存的连接数、当前活跃的连接数)

3. 每秒查询数(qps)
4. 慢查询
5. 主从状态、复制延迟
6. IOPS(Input/Output Per Second)
负载均衡器监控1. 后端健康检查:端口检查、http健康检查
2. 每秒请求数、请求/响应时间

3. 前端/后端的HTTP响应码

4. 客户端到LB/LB到后端的:连接数、流量、带宽

消息队列监控1. 队列长度
2. 消费率

3. 异常率

4. 消息积压

缓存监控1. 缓存命中率

2. 逐出项的数量

3. 连接数指标

DNS监控1. 区域传输数

2. 每秒查询数

3. 解析超时/无响应/出错/内容不匹配等

网络监控网络性能监控:带宽、吞吐率、延迟、错误、抖动、PPS等、并发连接数、丢包率、重传率、可用性
安全监控1. SSH:登录尝试和登录失败
2. syslog日志
3. auditd日志

  • 13
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值