要想合理的配置线程池,就必须首先分析任务特性,可以从以下几个角度来进行分析:
一、任务的性质:CPU密集型任务,IO密集型任务和混合型任务。
花费了绝大多数时间在计算上称为计算密集型(CPU密集型)computer-bound
花费了绝大多数时间在等待I/O上称为I/O密集型,I/O-bound
- CPU密集型时,任务可以少配置线程数,大概和机器的cpu核数相当,这样可以使得每个线程都在执行任务。
- IO密集型任务则由于需要等待IO操作,线程并不是一直在执行任务,则配置尽可能多的线程,如2*Ncpu。
- 混合型的任务,如果可以拆分,则将其拆分成一个CPU密集型任务和一个IO密集型任务,只要这两个任务执行的时间相差不是太大,那么分解后执行的吞吐率要高于串行执行的吞吐率,如果这两个任务执行时间相差太大,则没必要进行分解。
二、任务的优先级:高,中和低。
优先级不同的任务可以使用优先级队列PriorityBlockingQueue来处理。它可以让优先级高的任务先得到执行,需要注意的是如果一直有优先级高的任务提交到队列里,那么优先级低的任务可能永远不能执行。
三、任务的执行时间:长,中和短。
执行时间不同的任务可以交给不同规模的线程池来处理,或者也可以使用优先级队列,让执行时间短的任务先执行。
四、任务的依赖性:是否依赖其他系统资源,如数据库连接。
依赖数据库连接池的任务,因为线程提交SQL后需要等待数据库返回结果,如果等待的时间越长CPU空闲时间就越长,那么线程数应该设置越大,这样才能更好的利用CPU。
我们可以通过Runtime.getRuntime().availableProcessors()方法获得当前设备的CPU个数。
前辈们总结的一个估算合理值的公式:
最佳线程数目 = (线程等待时间与线程运行cpu时间之比 + 1)* CPU数目
例如:等待时间0.5s,运行时间0.2s,一个4核的电脑。(0.5/0.2+1)* 4 = 14
结论:
线程等待时间所占比例越高,需要越多线程。线程CPU时间所占比例越高,需要越少线程。