1. 记一次线程等待引起的bug解决过程
1.1. 问题
使用Springboot的Scheduled注解框架执行定时任务,发现线上突然不打任何日志了,我们要找到它不打日志的原因
1.2. 导出堆栈信息
- 我们使用的是阿里的k8s服务,其实哪里都一样,进到对应容器的里,导出堆栈信息
jps 或 top找到执行java程序的pidjstack -l pid > out.dump
然后退出容器后,使用docker cp 容器id:out.dump out.dump拿到本机目录,后用ftp拿到该文件
1.3. 分析堆栈信息
- 我使用了一个在线分析工具【https://thread.console.perfma.com/】,可以推荐下,将out.dump上传上去分析
想要找到对应线程,首先你日志得把对应的线程信息打印出来,根据之前打印日志的线程信息,可以知道该找哪个线程
然后找到对应线程打开
找到了阻塞的原因,由于多线程中countdown之前代码运行报错,导致不能执行countdown,使得await阻塞了,我把countdown放到finally中就可以解决该问题了