常见监控分为哪几类?

【这是一猿小讲的第 53 篇原创分享】

你们之中很多人多多少少都接触过监控,但是你所知道的监控,到底属于哪一类呢?这期我们就从下面这张图开始聊起。如图所示,可以清晰的看出,监控的世界可以被划分为基于 Logging 的监控、基于 Tracing 的监控、基于 Metrics 的监控。

 

图片来源:http://peter.bourgon.org/blog/2017/02/21/metrics-tracing-and-logging.html

基于 Logging 的监控,背后对应的是日志系统。我们都知道,线上服务在马不停蹄的向外喷日志,但是可以通过 FileBeat、Flume 等 Agent 完成日志的采集,并存储到 ElasticSearch 中,然后可以通过 Kibana 或者其它自研查询组件进行展示,从而完成了日志的归集、分析展示。往期的文章《傻瓜也能玩转日志归集》、《玩弄日志归集于手掌之中》已经聊过对应的开源解决方案,若不太清楚,可以回顾一下。

 

基于 Tracing 的监控,背后对应的是追踪系统,也有人叫调用链系统,做 APM 应用性能监控这块是必不可少的。可以粗略的认为是一次服务的调用过程,中间经过了哪些环节,也就是所谓的调用链条性能统计。往期文章《一篇文章讲透线上应用监控》也提到过业界 APM 应用性能监控开源的轮子,也可以回味一下。

 

基于 Metrics 的监控,背后对应的是度量(指标监控)系统。当然可以粗略的理解为一段时间内的指标统计,例如机器在某段时间内的 CPU 使用率、系统负载;应用在某段时间内的 HTTP 请求访问量;MySQL的连接数、QPS等。

 

关于 Logging,Tracing 对应的解决方案,我们曾经多多少少都谈及过,但是关于 Metrics 解决方案却没有谈及,略感遗憾。那么有没有基于 Metrics 监控对应的开源解决方案呢?如果有这样的开源轮子,拿过来必定事半功倍的,腾出更多时间去冲咖啡。

 

 

庆幸的是开源轮子一大筐,这不当普罗米修斯(Prometheus)遇到格拉法纳(Grafana)再配上 One Exporter 就组成了监控界的嘻哈 PGOne,呦呦切克闹开源监控成一套。

 

那具体什么是普罗米修斯?什么是格拉法纳?Exporter又是啥?各位看官心莫急,我们将在接下来的几期分享挨个带你们认识认识。

 

好了,如果这次的简短的分享看着还算顺眼,不妨发扬一下风格,动动手指分享一下,让更多人一起进步。

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在数据库运行过程中,常见的故障主要可以分为以下几类: 1. 硬件故障:包括硬盘故障、电源故障、内存故障、网络故障等。通常需要更换故障部件或者修理硬件设备。 2. 数据库损坏:包括数据文件损坏、日志文件损坏、索引损坏等。通常需要进行数据库恢复和数据修复操作。 3. 网络故障:包括网络中断、网络丢包、网络延迟等。通常需要检查网络连接、路由器、交换机等设备,确保网络畅通。 4. 软件故障:包括操作系统故障、数据库软件故障、应用程序故障等。通常需要重新启动软件或者重新安装软件。 针对不同的故障,恢复的方法也不同: 1. 硬件故障:通常需要更换故障部件或者修理硬件设备。如果有备份设备,则可以将备份设备替换到故障设备的位置上。 2. 数据库损坏:通常需要进行数据库恢复和数据修复操作。对于轻微的损坏,可以通过恢复备份文件来进行恢复。对于较严重的损坏,需要使用数据库恢复工具进行修复。 3. 网络故障:通常需要检查网络连接、路由器、交换机等设备,确保网络畅通。可以通过重新连接或者更换设备来解决网络故障。 4. 软件故障:通常需要重新启动软件或者重新安装软件。如果软件故障导致数据损坏,需要进行数据恢复和修复操作。 总之,在数据库运行过程中出现故障是很常见的,需要根据不同类型的故障采取不同的恢复方法,以确保数据库的正常运行。同时,也需要对数据库进行备份和监控,及时发现和解决问题,避免故障带来的损失。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值