问题描述
Linux下多线程(scoll slice)导出es中数据然后在内存中进行操作(1000W级),每次程序导出数据到一定程度的时候CPU飙升到100%原因分析
1. 查看该Java程序的哪一个线程占用的CPU较高: top -Hbp 3557 | awk '/java/ && $9>50'
上图可以看出这几个线程占用CPU巨高,均为99.9
2. 查看JVM中此时的线程情况: jstack 3557 > /a.log 将结果导入到 文件中
然后在文件中查看这几个线程id对应的线程情况: 3560转成16进制: de8 即: 0xde8
在文件中搜索de8,结果如图:
是GC线程一直占用CPU.
分析: 由于数据量巨大,1000W级,使用List存储数据时,非常耗费内存,当JVM内存不足时,GC线程一直进行GC
解决方案:
调大JVM内存,将内存调到30G的时候就没有这个问题了
后记
- JVM为什么没有抛出OutOfMemory的异常,而是一直在GC呢?
- 从es取数据到内存中进行操作的原因是:在es集群中聚合不出结果,那么一般都是如何解决的啊?
参考
https://blog.csdn.net/flysqrlboy/article/details/79314521
追加点
其实都是从人家的博客上看到的具体的实施方案和解决思路,是不能算原创