【实战】我的服务监控实践
文章平均质量分 96
我的服务监控实践
蓝胖子的编程梦
多年互联网大厂开发经验,深耕后端领域,擅长golang、云原生技术栈。对性能优化和服务监控方向颇有心得,对分布式链路追踪,故障诊断,实时数据分析,监控告警平台建设,性能优化及架构设计有深入研究
展开
-
【升职加薪秘籍】我在服务监控方面的实践(8)-elasticsearch 性能监控与分析手段
通过这一节,我们利用四大黄金指标原则分析了如何对es集群进行了监控,你可以发现,即使你对组件没有很深入的了解,四大黄金指标原则依然能够很好的指导你如何建立监控维度。相信通过这一节,你会更加深入的理解四大黄金指标原则。并且,我们对elasticsearch的监控依然没有脱离定位问题这一目的,我们通过索引维度的qps,延迟监控,保留问题现场来更好的定位问题,注意,监控不仅要发现问题,还要定位问题,这也是我对创建什么样的监控指标所遵循原则,只有定位到了问题才能快速的解决问题。原创 2023-08-23 17:45:26 · 68 阅读 · 0 评论 -
【升职加薪秘籍】我在服务监控方面的实践(6)-业务维度的mysql监控
这一节我们完成了对mysql的监控,不过这个监控指标是在传统数据库监控项基础上建立的,目的是为了让监控指标更加容易反映到业务上,方便问题定位,在下一节我将会演示如何对redis进行监控,与mysql监控类似,我们也需要从业务维度思考对redis的监控。原创 2023-08-22 17:00:08 · 74 阅读 · 0 评论 -
【升职加薪秘籍】我在服务监控方面的实践(7)-业务维度的redis监控
大家好,我是蓝胖子,关于性能分析的视频和文章我也大大小小出了有一二十篇了,算是已经有了一个系列,之前的代码已经上传到github.com/HobbyBear/performance-analyze,接下来这段时间我将在之前内容的基础上,结合自己在公司生产上构建监控系统的经验,详细的展示如何对线上服务进行监控,内容涉及到的指标设计,软件配置,监控方案等等你都可以拿来直接复刻到你的项目里,这是一套非常适合中小企业的监控体系。原创 2023-08-23 17:47:29 · 66 阅读 · 0 评论 -
【升职加薪秘籍】我在服务监控方面的实践(3)-机器监控
在这一节,我们通过node exporter 建立起了对机器层级的监控,涉及cpu,内存,磁盘,网络,其中涉及的监控面板来自于现有的监控模板node exporter full,不过由于node exporter full 数量实在太多,我们挑选了一些组成了最终的监控模版,模版的json文件已经放到了文章开头, 你完全可以将它直接导入到你的grafana项目里,建立起对机器层级的监控。原创 2023-07-26 15:24:27 · 90 阅读 · 0 评论 -
【升职加薪秘籍】我在服务监控方面的实践(4)-日志监控
总结下,这一节我们完成了EFK组件的搭建与配置,并且详细解释了相关的配置文件和注意事项,再次强调的一点是,别让日志采集占用主机的太多资源,一切以应用程序正常运行为主。在下一节我将会介绍如何对应用程序进行监控了,这也是我们写应用程序代码比较喜欢关注的地方,下节再见。原创 2023-08-09 11:51:39 · 68 阅读 · 0 评论 -
【升职加薪秘籍】我在服务监控方面的实践(9)-报警设计
我们再来回顾下之前介绍的架构图,我们拥有一个自定义的告警服务。整个报警来源主要分两部分,日志告警和指标告警,日志告警会对整个系统里错误等级的日志进行告警,指标告警则是在grafana上建立告警规则,最后通知到自定义的告警服务,由告警服务发送告警到各自的告警群。原创 2023-08-30 17:44:45 · 90 阅读 · 0 评论 -
【升职加薪秘籍】我在服务监控方面的实践(2)-监控组件配置
大家好,我是蓝胖子,关于性能分析的视频和文章我也大大小小出了有一二十篇了,算是已经有了一个系列,之前的代码已经上传到 github.com/HobbyBear/performance-analyze ,接下来这段时间我将在之前内容的基础上,结合自己在公司生产上构建监控系统的经验,详细的展示如何对线上服务进行监控,内容涉及到的指标设计,软件配置,监控方案等等你都可以拿来直接复刻到你的项目里,这是一套非常适合中小企业的监控体系。在上一节我们其实是建立起了对监控的概念,对监控什么,如何监控有了大致的印象。原创 2023-07-25 15:17:17 · 75 阅读 · 0 评论 -
【升职加薪秘籍】我在服务监控方面的实践(5)-应用监控
这一节,通过对应用服务建立黄金指标和使用holmes做到保留问题现场,构建起了对应用服务的监控。并且你可以回忆整个过程,是不是在指标异常的时候,我们可以很方便快速的定位到问题代码,这也是监控的目的,不仅发现问题,还要能定位问题。在下一节我将会介绍如何从对mysql进行监控,并且能够通过mysql监控指标,找到应用代码不合理有风险的地方。原创 2023-08-10 16:14:55 · 81 阅读 · 0 评论 -
【升职加薪秘籍】我在服务监控方面的实践(1)-监控蓝图
简单总结下,这一节我们主要了解了整个系统的监控架构,以及监控的目的,如何去设计指标,让自己对监控 相关的知识有个谱。在接下来的时间,我们就要正式动手开干了。原创 2023-07-24 14:34:02 · 82 阅读 · 0 评论