监控运维实践---原则与策略--阅读笔记

前言

监控是观察并检查系统及其组件随着时间的推移而产生的行为和输出

前4章:监控的原则:需要注意的反模式,以及思考监控的新方式。
第5章-第11章:监控的策略:监控什么、为什么要监控,以及如何监控。

第一部分 监控的原则

第1章 监控反模式

反模式就是看起来很好,但是应用时往往会弄巧成拙的模式。

  • 反模式1:沉迷工具
  • 反模式2:监控岗位化
  • 反模式3:复选框式监控,即为了表明有监控而部署监控。
    对告警来说,操作系统指标(例如CPU使用率)不是很有用
    收集指标的频率至少应是每60秒一次。如果系统的流量高,就应该选择更高的频率,例如每30秒甚至每10秒收集一次。
    确保为指标数据设置一个合理的滚动周期。
  • 反模式4:把监控当作拐杖 虽然监控有利于发现问题,但是更重要的是解决问题。
  • 反模式5:手动配置 监控应该是完全自动化的。

第2章 监控设计模式

2.1 设计模式1:可组合监控

原则:使用多个专门的工具,并且将它们松散地组合在一起,以形成一个监控平台。
一个监控服务有以下5个基本组件

  • 数据采集
  • 数据存储
  • 可视化
  • 分析和报告
  • 告警
1. 数据采集
采集方式

用于采集数据,实现方式主要有两种:推送拉取
拉取: 有一个服务区请求远端的节点来发送其数据,难以横向扩展。
推送:一个客户端(服务端、应用程序等)基于定时任务或随事件触发的方式推送数据至另一个位置。由于没有中央轮询器,因此在分布式架构中的推送模型更容易实施横向扩展,拥有更好的冗余性和高可用性。

采集内容

指标日志
指标:有计数器仪表两种不同的表现形式。计数器是一个不断增长的指标,非常适用于记录网站累计访问用户数这类事情。仪表是时间点值,例如汽车的速度表。仪表无法显示过去的值,也无法预测将来的值,但是可以将仪表的值存储在一个时间序列数据库(TSDB)中,随后提取并绘制成图表。
日志:本质上是带有关联时间戳的文本字符串在时间发生时用以指代事件的记录。有两种类型:非结构化日志结构化日志。最常见的日志收集途径是在系统上设置日志转发。

2.数据存储

作为时间序列数据,指标通常存储于TSDB中,TSDB是一种专门存储时间序列数据的数据库,数据基本上是由时间戳以及值组成的键值对,称为数据点。
日志存储:有些系统将数据存储为普通的平面文件,而更高级的解决方案是将日志文件存储于搜索引擎中。

3.可视化

最常用的方式是线状图。不要用饼状图。
最好的仪表盘会专注于显示某个单独服务或单个产品。

4.分析和报告

最常见的用例之一是对应用程序和服务在服务层可用性上进行确定和报告。

5.告警

监控不是为了生成告警而存在的,告警只是其中一种可能的结果。

2.2 设计模式2:从用户角度监控

添加监控的最佳地点首先是用户和应用程序交互的点。
最有效的监控之一是HTTP响应码(尤其是HTTP 5xx 这一类),然后是监控请求时间(也叫延迟)。

2.3 设计模式3:购买,不要构建

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值