故障分析
文章平均质量分 85
对于线上发生的故障进行分析
编号94530
新时代 积极 向上 奋斗 好 青年
展开
-
(WebFlux)004、WebFilter踩坑记录
1、遇到问题,还是要多看看呀,细细思考一下2、多看代码,发现问题,实现完美的解决方案。原创 2022-09-28 21:53:24 · 1611 阅读 · 1 评论 -
OpenFeign和Consul爱恨交织的两天
1. 背景在公司对项目进行拆分,用consul做注册中心。既然弄注册中心了, 那就得远程调用,那就得整上OpenFeign进行远程调用,你说是不? 不能说就搞个RestTemplate+服务名调用吧?想法有了,说动就动,就对项目就行拆分,在拆分的过程中,就把我学到的拿出来和大家分享分享。(我也是第一次用consul,没啥经验)2. 爱与恨2.1 恨2.1.1 远程调用失败在信息远程接口调用时,一直抛出异常:Load balancer does not have available server f原创 2020-11-19 22:35:38 · 659 阅读 · 0 评论 -
记一次线上事故
1. 事故发生某天晚上,收到系统CPU占用过高报警,立刻登录服务器查看cpu信息(top,命令即可),此时CPU占用率高达750%+, 查看GC日志,频繁的发生Full GC, 并且一次Full GC市场可达到6s,立刻使用jmap命令dump文件(命令:jmap -dump:file=heap.bin )。立刻重启服务,恢复一部分机器,保证服务可用。重启后,系统恢复正常。2. 堆栈分析把dump的文件从服务器弄下来,然后使用MAT工具分析(dump的文件有点大,注意调整MAT内存大小,对MAT不熟悉原创 2020-05-14 23:25:53 · 179 阅读 · 0 评论