线上错误排查
多动手,勤思考
阿布
展开
-
【线上错误排查】死循环导致的Java服务线上CPU飚到100%,代码定位排查
线上某服务器,阿里云CPU报警飙升到100%,因为业务量并不是很大,平常CPU也都很平稳,根据直接,第一反应就是某位小哥哥的代码写法出现了问题导致了死循环一直占用CPU。项目运行环境是Tomcat8,服务直接打成war包丢进去运行的。话不说说,进入正题,1、登录进入服务器ssh …2、查看进程占用资源输入命令 top 查看进程占用资源,此处可以看到占用最高的进程,一般CPU这一列都会...原创 2019-08-08 21:31:01 · 1015 阅读 · 0 评论 -
【线上错误排查】数据库连接池不够用导致的服务集体雪崩
笔者参与了一个产品型项目,流量中等,每天都有很多人在使用,该项目很奇葩,每周六晚上的某个时间段,必定会挂~此时恢复手段就是重启~,事后根据挂掉的日志去进行代码等方面的优化笔者刚参与项目两周左右,因为没有服务器的权限,就向有权限的同事要了一份当时挂掉的日志来查看,发现了80% 左右都是数据库的错误,或者是因为数据库挂掉导致的微服务间调用链失败的错误其中让笔者发现关键错误的一段log,如下Th...原创 2019-08-08 21:57:07 · 3180 阅读 · 0 评论