![](https://img-blog.csdnimg.cn/direct/5c607e920f4f46498735e2492b4da644.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
服务监控实践案例分析
文章平均质量分 95
身为一个后台开发,对于服务监控必不可少,我会陆续出一些自身对服务监控的理解,分析线上真实的监控案例,希望能给各位带来启发。
蓝胖子的编程梦
多年互联网大厂开发经验,深耕后端领域,擅长golang、云原生技术栈。对性能优化和服务监控方向颇有心得,对分布式链路追踪,故障诊断,实时数据分析,监控告警平台建设,性能优化及架构设计有深入研究
展开
-
【Elasticsearch系列】不幸中的万幸 —— 一次elasticsearch 查询瞬间超时案例分析
其实,你可以看到,整个排查过程是比较顺畅的,但是要完成这一系列比较顺畅的排查动作前提是要有比较完善的监控机制。无论是对组件还是机器乃至应用服务的监控,我们都设有比较完善的监控图表用于保留问题现场。对于慢查询日志则是直接发往了钉钉群,这也有利于快速对慢查询进行发现和修改以及对慢查询进行检索。有了这些监控机制,当问题发生时,只需要分层的去观察不同层的监控情况,问题便能迎刃而解了。对于如何落地一个能用于生产环境的监控机制,欢迎收看我直接的服务监控实践系列。原创 2023-12-04 16:45:39 · 1285 阅读 · 0 评论 -
mysql invalid conn排查
服务使用golang ,客户端库是go-mysql-driver ,系统但是不总是报出invalid conn 错误,但实际拿sql执行时却是正常执行。原创 2023-07-12 23:19:21 · 161 阅读 · 0 评论 -
我将性能提升了百分之20 —— 一次系统延迟优化案例
线上隔三差五晚上10点左右总会有sql报警出现,且是同样的sql,我们的sql报警是在应用程序内部通过对sql操作增加钩子函数,对sql前后执行的位置记录下时间戳,然后sql执行完毕后,对时间戳进行相减得到sql执行时长,大于1s则报警。晚上10点正好是我们的业务高峰。部分接口也会在此期间出现超过2s的响应。原创 2023-06-19 10:08:01 · 114 阅读 · 0 评论 -
我又和redis超时杠上了
About🔥🔥性能优化,服务监控方面的知识往往涉及量广且比较零散,希望将这部分知识整理成册,愿以后性能排查不再抓瞎。原创 2023-06-02 12:59:13 · 49 阅读 · 0 评论 -
wireshark分析tcp传输之文件上传速率问题
这一节 主要用了 tcp stream graphs 宏观的去分析了文件上传时tcp的传输过程,wireshark提供的高级功能,这一节只是冰山一角,希望能抛砖引玉。我认为,网络抓包无处不在,其实随手就可以抓取上网浏览的包去进行分析,然后通过wireshark把包传输过程的表现都用理论知识找到对应的解释,不断深挖下去,便会融会贯通。原创 2023-05-31 11:44:36 · 1215 阅读 · 1 评论 -
一次排查某某云上的redis读超时经历
性能排查,服务监控方面的知识往往涉及量广且比较零散,如何较为系统化的分析和解决问题,建立其对性能排查,性能优化的思路,我将在里给出我的答案。原创 2023-05-30 10:32:27 · 231 阅读 · 0 评论