- 博客(266)
- 资源 (10)
- 收藏
- 关注
原创 【极简监控·进阶篇】AI助力复刻 Glowroot智能截流,打通 SkyWalking-Local告警的任督二脉
本文详细介绍了如何借鉴 Glowroot 的"智能截流"理念,在 SkyWalking Agent 探针与业务层之间构建一套高效、可控的告警闭环机制。通过创新的 HTTP Webhook 方式击穿 ClassLoader 隔离墙,结合严谨的分层评估模型、异步分发与防告警风暴机制,实现了只针对"慢请求"和"错误链路"的精准告警。同时,通过白盒化监控大盘确保告警系统自身的可靠性,为研发团队提供了内部可控的极速闭环解决方案。
2026-05-27 19:23:15
228
原创 【极简监控·进阶篇】放弃 Prometheus!用 RRD4j 打造纯本地“微型时序库”,破解持久化难题
本文是《极简模式下单体Java应用的监控落地思路》专栏的深水区探索,针对纯内存监控方案"重启即清零"的痛点,提出基于RRD4j实现零运维成本的持久化方案。文章详细阐述了从JavaMelody到RRD4j的技术选型历程,科普了RRD环形数据库的核心原理,并展示了如何通过"Composite双写引擎"架构将RRD4j无缝融入现有监控体系。最终通过AI辅助快速落地,实现了系统CPU/内存历史趋势的可视化,为单体应用构建了"内存保现场,RRD记历史"的完整时间闭环监控防线。
2026-05-26 17:24:35
308
原创 【极简监控·进阶篇】跨系统甩锅的终结者!AI 助力魔改 SkyWalking 插件,让 HTTP 调用入参无所遁形
本文针对跨系统协作中下游服务报错时难以追溯请求参数的痛点,介绍了如何基于已有的 SkyWalking-Local 极简监控底座,借助 AI 大模型能力对 SkyWalking 原生 HTTP 客户端插件进行"外科手术式"魔改。通过扩展插件动态抓取 HTTP 请求体参数,并设计动态启停与长度截断机制保障生产环境性能,实现了在故障排查时能精准还原调用现场,彻底终结上下游开发团队间的"盲盒式"对峙与无休止扯皮,将每一次跨系统调用的证据牢牢掌握在自己手中。
2026-05-19 20:56:45
404
原创 【极简监控】不吹不黑:你的系统该用“极简监控”还是“重型 APM”?一文划定选型边界
本文探讨了极简监控体系在不同架构场景下的适用边界。文章指出,对于传统单体Java应用、"伪微服务"小集群以及边缘单体服务,极简监控(如Glowroot、Actuator等)具有投入产出比高、运维成本低的优势。但当面对大规模节点(>10台)、深度微服务调用链(>3层)或高合规要求时,必须采用Prometheus+Grafana+集中式APM等重型监控方案。作者强调架构选择应基于实际业务场景和团队能力,避免过度设计,在合适场景下充分发挥极简监控的价值。
2026-05-16 11:04:22
389
原创 【极简监控·番外随笔】一个老兵的反思:观察行业十年,我为什么非要死磕“单体极简监控”?
本文探讨了单体Java应用极简监控体系在业界罕见的原因。作者指出,微服务时代重型监控成为"活命刚需",而单体应用依靠"重启大法"即可应付;职场生态中"面向简历编程"导向使人们更关注花哨技术;项目交付的短生命周期和成本导向也抑制了对非功能性需求的投入。此外,绩效考核往往错位,预防性工作不如救火行为显眼。尽管如此,作者仍坚持完成该专栏,认为这是对工程师文化的回归,为追求卓越的技术人提供工具,也是应对行业"降本增效"趋势的未雨绸缪。文章呼吁在妥协的现实环境中保持技术追求,打造坚如磐石的系统。
2026-05-15 10:04:48
364
原创 【极简监控·进阶篇】综合实战:1+1>>10 的降维打击!联动底层工具,暴力提取 SkyWalking“悬空链路” (滞留 In-flight 请求)
本文提出了一种突破单一监控工具局限性的综合解决方案,通过联动Undertow卡死检测与SkyWalking链路追踪,解决线程挂起时业务上下文丢失的难题。核心创新点在于利用反射机制从卡死线程的ThreadLocal中暴力提取SkyWalking未上报的"断头链路"数据,包括请求URL、业务参数等关键信息。该方案通过开发诊断接口/stuck-threads/skywalking-dump实现跨ClassLoader的数据榨取,有效解决了传统监控中"Undertow抓不到业务
2026-05-12 15:38:56
483
原创 【极简监控】告别 OAP 与 ES!一个 Agent 搞定全链路与 UI,探秘单体 APM 界的“核潜艇” Glowroot
文章摘要: 本文介绍了一款轻量级Java应用监控神器Glowroot,堪称单体极简监控的终极解决方案。相比传统APM工具复杂的部署架构,Glowroot仅需一个不到10MB的JAR包,通过-javaagent参数零侵入接入,即提供全链路追踪、火焰图分析和智能告警等能力。其独创的"慢请求优先存储"策略,在保证本地存储轻量的同时精准捕捉性能问题。与JavaMelody相比,Glowroot在界面交互、链路追踪和微服务扩展性上更具优势。
2026-05-03 17:46:28
510
原创 【极简监控】挖出被遗忘的 JMX 金矿:用 Jolokia + Hawtio 把 VisualVM 搬进浏览器
本文探讨在“极简单体监控”理念下,如何挖掘Java内置JMX这一“上古金矿”。JMX作为JVM原生基石,零部署即可暴露线程池、GC、连接池等深水区运行数据。文章提出渐进式策略:先通过Micrometer桥接,将JMX的MBean指标拉取到统一注册中心;再用Jolokia把封闭的JMX RMI协议转为HTTP/JSON接口,打破网络枷锁;最后借助Hawtio,在浏览器中构建媲美VisualVM的诊断座舱,实现指标走势图、线程分析等可视化功能。
2026-04-25 21:38:48
394
原创 【极简监控】选连接池送深度监控?用 Druid 补齐单体应用全局 SQL 统计的最后拼图
摘要: 本文介绍如何利用Alibaba Druid数据库连接池为单体Java应用补全SQL监控能力。针对SkyWalking-Local仅保留最近1000条Trace数据的局限,Druid通过内置统计功能提供全局SQL分析,包括执行频次、慢SQL排行等关键指标。在Spring Boot中仅需配置druid-spring-boot-starter即可启用可视化监控面板,老旧项目也可通过替换数据源实现无侵入接入。结合SkyWalking的链路追踪,形成"宏观统计+微观定位"的完整监控闭环,零
2026-04-04 23:34:40
501
原创 【极简监控】告别繁琐SSH!一个Jar包,把SpringBoot日志搬进浏览器的“神仙组件”
本文介绍了一款极简日志监控工具 log-viewer,它能以近乎零成本的方式解决Java应用日志查看的痛点。传统查日志需要SSH登录服务器、使用复杂命令,而该工具只需引入一个Jar包,即可通过Web界面实现类似IDE的日志浏览体验,支持实时滚动、智能高亮和在线过滤。相比自研方案或ELK等重型系统,它无需额外部署,完美适配Spring Boot和老旧Java应用,同时提供完善的安全配置。该工具将排障能力前置,让非技术人员也能自主查询日志,大幅提升研发效率,是单体应用监控的理想选择。
2026-04-04 23:00:06
398
原创 【极简监控】只需一个Jar包!单体监控“活化石” JavaMelody,真正的开箱即用
在云原生和微服务满天飞的今天,JavaMelody 就像一把复古的瑞士军刀。它不花哨,但极其可靠。做监控不一定要兴师动众,单体应用只要深挖自身潜力,同样能打造出近乎滴水不漏的铁板防线。快去你的应用里引入它吧,看看那些隐藏在暗处的慢 SQL 都是怎么作妖的。手握铁证,咱们开开心心准点下班!
2026-04-02 22:07:19
431
原创 【专栏导读】拒绝过度设计!零运维成本打造单体Java应用的“铁桶级”极简监控体系
没有最好的架构,只有最适合当下的架构。单体应用有单体应用的尊严与轻盈。如果你也受够了陷入无穷无尽的“自证清白”泥潭,如果你也对维护大而不当的重型监控系统深恶痛绝,那么欢迎订阅本专栏。“监控不应该是研发的负担,而应该是随手可用的利器“。让我们一起回归工程本源,用最少的代码办最硬的事,筑牢防线,准点下班!
2026-03-29 11:41:33
540
原创 【极简监控】不骗篇幅!7个零运维成本的排障“微操”,让线上问题彻底左移
本文分享了7个提升Java应用监控与排障效率的实用技巧,涵盖线程流量监控、免SSH运维和自助信息获取三大方向。通过Undertow防卡死检测、logback-access日志追踪、Arthas线程分析等技术,实现请求全链路监控;借助Web化日志浏览、文件管理和SQLite查询工具,消除传统SSH操作;结合AI可视化将系统信息自助化,形成"排障左移"的三层防护体系。这些轻量级方案不依赖重型监控工具,通过深度挖掘现有组件潜力,显著降低日常运维门槛,让问题在抵达研发前就被拦截解决。
2026-03-28 22:19:51
374
原创 【极简监控】核弹级排障利器:仿 Jenkins Script Console 打造免重启诊断“黑科技”
不要让重度依赖毁了单体应用的轻盈,也不要让盲目重启掩盖了故障的真相。在极简监控与诊断体系中,仿是我们插在系统深处的一把尖刀。结合严格的安全管控,它让我们在面对线上事故时,拥有了**不用发版就能直接“给心脏做微创手术”**的底气。至此,我们的极简监控单体防线,已经具备了从“被动看”到“主动修”的完整闭环。关注本专栏,告别甩锅扯皮,让我们一起开开心心准点下班!
2026-03-28 19:37:02
409
原创 【极简监控】打破中间件黑盒:用 Micrometer 打造“SLF4J式”的降维打击Metrics监控体系
0 额外服务器部署,0 运维成本,极少的 Java 配置代码。应用内所有核心依赖组件(DB池、RPC、Web容器)全方位透明化。过去需要专家级经验才能排查的中间件假死、线程耗尽问题,现在辅以趋势图和 AI 分析,初中级开发也能一眼望穿。有了这套基于 Micrometer 打造的“SLF4J 式”监控防线,单体应用内部的层层迷雾被彻底拨开。你的系统,真正变成了让别人无法碰瓷甩锅的“铁桶一块”。
2026-03-28 19:05:04
497
原创 【极简监控】榨干 Spring Boot Actuator 的最后一滴血:单体应用的免运维排障神器
你到底发版没?为什么 BUG 还在?我发誓我清缓存了!“我发誓配置肯定加上去了!一定是哪里没生效!“机器卡成 PPT 了,SSH 都连不上,肯定是你代码死循环了,赶紧重启吧!面对这些需要反复拉锯、自证清白的场景,如果我们还秉持传统思路去搞一套复杂的分布式配置中心、重型诊断 Agent,那就又掉进了“过度设计”的陷阱。最大化挖掘 Spring Boot Actuator 的内置价值,配合前端可视化与 AI 分析,将排障所需的 Context(上下文)直接通过 HTTP 端点暴露出来。
2026-03-28 13:45:42
443
原创 【极简监控】拒绝 Prometheus 绑架!用 Oshi 打造单体应用的基础设施“铁桶”防线
本文分享了一种极简化的Java单体应用监控方案,通过Oshi库实现零运维成本的基础设施层监控。针对传统重型监控体系的痛点,提出仅保留最近半天数据的轻量级策略:以1分钟为采样间隔,将CPU、内存等指标存入内存环形队列,配合AI工具快速生成趋势图。该方案摒弃长期数据存储,专注实时故障排查,既避免性能损耗,又能快速定位问题根源。作者强调用最小成本构建实用监控体系,后续将继续分享中间件层和应用层的轻量级监控实践。
2026-03-28 12:49:24
414
原创 【极简监控】告别重度存储!用 InMemoryMetricsCollector 搞定 99% 的单体应用Metrics排错
监控的本质到底是什么?眼前问题发生时的快速定位(比如:刚才这几分钟为什么接口响应变慢了?线程池是不是满了?基于数周甚至数月的统计分析,找出系统隐藏的问题(比如:近半年的系统容量演进趋势)。对于 99% 的单体业务应用来说,真正的痛点基本都在前者。很多应用甚至直到下线,都没有用到过第二种维度的能力。为了那 1% 的“长期统计”伪需求,去搭建庞大的时序数据库、维护沉重的存储集群,这显然是个吃力不讨好的脏活累活。的诞生,是我们向“过度设计”开的一炮。只要几行代码,一个Supplier。
2026-03-26 22:07:43
387
原创 【极简监控】告别沉重的OAP!一款专为单体应用打造的 SkyWalking 轻量级本地化 Reporter 插件
本文介绍了一款轻量级监控插件skywalking-logfile-reporter-plugin,旨在解决传统SkyWalking监控方案在单体应用中的过度设计问题。该插件通过拦截SkyWalking Agent采集的数据并存储在本地内存的有界队列中(默认1000条),既保留了SkyWalking强大的无侵入式探针能力,又彻底摆脱了对OAP Server和Elasticsearch等后端依赖。其核心优势包括零运维成本、完整功能保留、良好兼容性和一键式接入。
2026-03-26 13:58:46
536
原创 【SpringBoot】优化慢启动应用的用户体验
通过深入分析SpringBoot中WebServer的启动流程,插入自定义的Loading页面展示逻辑,优化软件使用时的用户体验。
2024-08-19 20:55:02
743
1
原创 【DEVOPS】gitChecker快速使用指南
[Gitee - gitChecker](https://gitee.com/lqzkcx3/gitchecker)借鉴自SVNChecker, 简化GIT服务端的Hook功能实现,实现逻辑复用。
2024-07-29 21:08:50
598
原创 IDP之Backstage - 环境搭建
本不想写这篇,因为看着官网文档写着挺简单的,但实际操作起来却是步步坑。于是怒而把过程细节重演一次并记录下来,于是就有了这篇。
2024-04-15 12:01:02
1092
原创 中拔出溜的公司如何落地监控体系
最标准的自下而上推进监控体系落地 —— 完全兼容现状,属于"晓之以理,不如诱之以利",先让对方看到效果,然后反向推进改良。
2024-04-05 22:29:29
1324
原创 【技巧】SpringCloud Gateway实现多子域(单个应用开放多个端口)
浏览器针对单个网站地址(ip+port)存在“6个请求”限制;SpringCloud Gateway中通过实现多子域配置来突破这个限制,增加网站的响应效率。
2024-03-02 14:32:34
1321
4
原创 【Loki】最佳实践 - 基于LogQL的Metric
站在系统全局,站在研发和产品的视野上,换位思考之下自主分析总结出更多的指标。不断为了系统优化指明方向,将系统优化方向的指导权牢牢掌握在自己手上,化被动为主动
2023-11-11 13:11:36
976
原创 【DEVOPS】技术团队角色分工
我们的最终目标是打造“ALL IN IDE”的研发体验,业务研发团队应该对于整个流程无感知,需要知道的细节越少越好 。
2023-07-19 22:34:55
760
rt.jar的源码文件
2016-05-15
ADO.NET本质论
2015-08-18
cat-maven-plugin源码
2019-03-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅