故障排查
文章平均质量分 77
QGBigdata
大数据技术相关技术贴
展开
-
一次log4j的导致的OOM 破案之旅
起因上周下午,正当我准备早早下班的时候,收到了一条报警信息,XX机器的XX服务不可用,按照运维操作步骤,先把服务恢复再说,由于服务是高可用,对业务没有影响,但是还是要找出出现问题的原因,避免下次再出现。按照之前的文档处理完重启之后,需要花点时间定位一下为什么进程会退出。日志首先,关注是日志,在日志中,出现了下面的信息java.lang.OutOfMemoryError: GC overhaed limit exceeded . 一般来说,导致OOM的有两种情况:数据量增加,导致的堆的空间不原创 2021-04-29 09:46:36 · 839 阅读 · 2 评论 -
使用Grafana Image Renderer 插件获取Grafana 监控图
需求来源最近领导提了一个新需求,让手下的人在早上股市开市之前把各自负责的核心系统的监控截图发送到企业微信群里面,本意是想让大家认真地做好巡检工作。但是,每天重复的截图实在是无聊,于是我花了几个小时写了一个脚本。脚本的作用是从grafana获取监控图片,并使用企业微信的报警机器人发送到微信群,实现自动化功能。使用Grafana Image Renderer 生成渲染的图片在Grafana 7.0之后,Grafana 官方提供了一个插件:Grafana Image Renderer,通过这个插件,用户可以原创 2021-04-15 13:13:58 · 5087 阅读 · 1 评论