问题描述
最近生产系统,某一台业务服务器偶发出现CPU执行90%以上。更严重者导致系统hang掉,事先未找到代码原因,拉取java core里堆栈信息后,发现
发现有几个线程的状态都是Runnable,程序定位在InventoryReportServiceImpl 服务类上,其他的线程都处于Waiting状态
代码定位:
找到该代码位置之后,发现此处代码的业务逻辑为:根据商品SKU去查询对应的商品主数据信息,由于要查询的商品sku数量比较多,所以开发者采取的思想是:通过多线程来进行这批商品的信息查询
实现方式:
通过创建线程池,然后for循环里每一个sku启动线程去查询对应的商品信息,等所有的线程都执行完毕之后,执行后续业务逻辑;这里采用的多线程的计数器来进行控制
初步分析:
每次通过页面点击查询,然后创建线程池,线程池里最大可执行8个子线程,如果sku待查询的商品数量过大的话,那么此过程执行完成耗时较长,此时如果该服务器业务量大的话,那么该报表在执行过程中,由于待处理的sku查询信息数较多,线程池一直处于runnalbe状态;其次:如果用户发现该报表一直未得到相应,就会进行多次点击查询,最后程序会根据多次请求,多次新建线程池,而线程池的多次创建,势必会增加系统消耗,导致CPU过高
进一步分析:
在java core里我们疏忽了一个点:
这句话HashMap.put,根据这条信息,在网上搜索后,发现别人遇到的现象和我们类似
后来根据资料上的例子,进行了本地机器的模拟,通过启动10个异步线程,其中有5个线程都在HashMap里进行put 10000次操作,其余5个进