记一次CPU飙高，频繁GC事件——大数据处理性能评估

最新推荐文章于 2022-12-13 11:50:17 发布

allione

最新推荐文章于 2022-12-13 11:50:17 发布

阅读量528

点赞数

分类专栏： java基础文章标签： java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dsydly/article/details/106280802

版权

java基础专栏收录该内容

15 篇文章 0 订阅

订阅专栏

1、背景：航班数据拆分，由原来的航班计划时间段拆分为每天的航班数据，未拆分的数据量400万，拆分为天的数据量1亿左右的数据。

2、部署到预发后进行数据拆分搬运之后的机器进程监控情况如下：

线程变化：

Old GC情况：

进入机器内部查看：

可以看到代码中的对象FlightScheduleSplitDO类创建的实例数852315，占用的内存空间204M，此实例一直在创建没有gc掉。CPU飙高，OOM。

3、原因如下：代码中逻辑，先从旧表中拿出200个待拆分的数据，然后丢到线程池中异步去执行，因为是while(true)，所以会不停的从旧表中拿待拆分的数据放入线程队列中，在线程池中的线程先将旧表中的数据拆分，然后插入到新表中，在拆分的过程中不停的创建SplitDO对象，因为线程池中的方法没有执行完，所以此对象不能快速的回收，导致该对象越来越多，还有其中的list集合与队列大对象，

解决办法：将拆分的逻辑和插入数据库的逻辑提出一个方法，同时将线程池的逻辑也放到一个方法中执行。这样方法执行完之后，其中的对象可以被提前回收掉。

其中线程池的大小是25，然后将所有的所有的未拆分的数据以1800为一组，放到list中，然后将list分为25组，每组n个1800，然后由25个线程同时执行，每个线程执行n*1800个数据，省略了线程池队列的大小，然后每个数据进行拆分的时候都是方法去执行，方法执行结束后所创建的实例在新生代中被回收。最终执行的时间由10个小时缩短为1个小时。

总结：

1、通过top查看CPU情况，如果CPU比较高，则通过top -Hp <pid>命令查看当前进程的各个线程运行情况，找到占用CPU的线程PID，然后通过jstack命令 jstack 44 | grep "0x1b6" 打印pid为16进制的1b6的线程堆栈信息，查看该线程主要进行的工作。

2、如果是正常的用户线程，通过堆栈信息可以找到具体在代码的哪一行消耗CPU。

3、如果是VM Thread，则通过jstat命令查看gc情况，通过jmap查看哪些对象比较消耗内存。以上的情况就是有大对象消耗内存。

4、比较耗时的代码，可以加大请求量，查找多个线程同时堵塞的代码行数。

5、某个线程处于waiting状态时间长，可以查看20S-30S的线程堆栈信息，如果一个用户线程一直是waiting状态则需要排查。

6、死锁，jstack命令可以直接打印死锁的线程信息。

后面的三种情况主要针对导致功能缓慢的情况排查。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
记一次CPU飙高，频繁GC事件——大数据处理性能评估

1、背景：航班数据拆分，由原来的航班计划时间段拆分为每天的航班数据，未拆分的数据量400万，拆分为天的数据量1亿左右的数据。2、部署到预发后进行数据拆分搬运之后的机器进程监控情况如下：线程情况没多大变化：Old GC情况：进入机器内部查看：...
复制链接

扫一扫

专栏目录

allione CSDN认证博客专家 CSDN认证企业博客

码龄12年

205: 原创

6万+: 周排名

201万+: 总排名

7万+: 访问

: 等级

2372: 积分

7: 粉丝

29: 获赞

7: 评论

125: 收藏

私信

关注

热门文章

分类专栏

最新评论

Junit中使用线程池不执行任务代码
做一个有追求的北漂: 注意到了得让测试方法休息一段时间,我也遇到这个问题,线程池的任务没有执行
Postman访问需要账号密码登入的页面_Allione_新浪博客
ctotalk: thanks,欢迎关注一起交流
环境复制实现_Allione_新浪博客
ctotalk: 感谢分享，学以致用。
vue增加数据导出excel（vue-json-excel）
ZHENQIANG1119: 直接把button放在<download-excel>里面就会出现上面的情况，但是如果将他们分开，先点击button获取数据，再点击<download-excel>就不会出现这样的情况，怎么破
vue增加数据导出excel（vue-json-excel）
ZHENQIANG1119: this.api({ url: "/easyExcel/exportPolicy", method: "post", data: excelCondition }) 我用axios，第一次点击的时候，虽然确实发出了请求，也获取到了数据，数据好像没有实时刷新，第一次点击不会生成下载弹窗，第二次点击的时候才会将第一次获取到的数据生成下载链接，而不是第二次所获取到的数据

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。