SRE - 监控建设

本文深入介绍了Site Reliability Engineering(SRE)中的监控体系,涵盖了SLI、SLO和SLA的概念,以及监控工具如Prometheus、BPC、RMS等的使用。文章还讨论了监控建设的方法,包括业务层、链路层、应用和系统监控,以及监控指标套餐、阈值设定和告警管理。最后,提到了故障应急策略和监控建设目标。
摘要由CSDN通过智能技术生成

监控

随着信息技术的迅速发展及其在商业和工业环境中的广泛应用,系统的可靠性成为了组织的生存之本。Site Reliability Engineering(SRE)作为一种实践的结合体,广泛地用于确保和提升软件系统的可靠性。其中,它的一个重要组成部分是制定和监控服务的关键性能指标(Service Level Indicators, SLIs)、服务水平目标(Service Level Objectives, SLOs)以及服务等级协议(Service Level Agreements, SLAs)。本文旨在深入介绍监控文档中的各要素,探讨监控工具的应用,以及阐述监控建设的方法和最佳实践,以实现高效的服务运维和故障应急。

目录

1     SRE的监控体系... 2

1.1         SLI(Service Level Indicator)... 3

1.2         SLO(Service Level Objective)... 3

1.3         SLA(Service Level Agreement)... 3

2     监控⼯具使⽤... 4

2.1         Prometheus. 4

2.2         BPC. 4

2.3         RMS. 4

2.4         业务监控平台... 5

2.5         听云... 6

2.6         Zabbix. 6

2.7         F5. 7

2.8         EM平台... 7

2.9         ELK大数据日志... 7

3     监控建设... 8

3.1         监控分层... 8

3.1.1              业务层.... 8

3.1.2              链路层.... 8

3.1.3              应⽤监控.... 8

3.1.4              系统监控.... 9

3.1.5              监控可视化.... 9

3.1.6              告警管理.... 10

3.2         监控指标套餐... 11

3.2.1              业务指标套餐.... 11

3.2.2              环境(可⽤性)指标套餐.... 12

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值