目录
为什么需要线程池?
因为线程的创建和结束都是非常消耗资源并且耗时的,因此就会想到,是否可以重复利用已经创建的线程,以此来节约资源的消耗。
此外,当一个任务到来时,直接使用已经创建的线程也可以提高响应速度。
另外线程是一种稀缺资源,利用线程池对线程进行统一的管理调度,可以增强系统的稳定性。
线程池的工作原理
1、提交一个任务到线程池之后(也就是执行thredPoolExecutor的execute方法),首先会判断核心线程池是否已满,也就是当前运行的线程数是否达到了corePoolSize,如果没满,那么创建创建新线程执行。
2、如果满了将任务加入“任务队列”;线程池中的线程执行完之后会从任务队列里面把任务提取出来执行。
3、而如果任务队列已满,那么再判断当前线程数量是否超过线程池最大容量maxiumPoolSize,如果没有超过,那么创建新的线程来执行。
4、而如果队列满了,并且当前线程池已经满了,也就是运行的线程数量数量超过了maxPoolSize,根据设定的饱和策略来处理。比如直接抛出异常,或者 直接丢弃掉,或者丢弃掉最近的任务,执行当前任务等等。
这四个步骤,对应下面图片里面的箭头1~4:
如何设计线程池的大小?
对于CPU密集型的任务,也就是说需要大量依赖CPU运算的任务,我们配置的线程池的规模应该小一些,比如Ncpu+1;而对于那种IO密集型的任务,比如说对于数据库的操作,线程提交SQL之后可能要等待很长时间才能获得结果,因此应该吧每个线程的 时间给的少一点,否则很长时间都浪费在了等待上,线程池的规模可以是:2*Ncpu。
线程池的具体操作:
1、线程池的创建
public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue) {
this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
Executors.defaultThreadFactory(), defaultHandler);
}
主要包括一下一些参数的设置:
- corePoolSize(核心线程池基本大小):当向线程池提交一个任务时,若线程池已创建的线程数小于corePoolSize,即便此时存在空闲线程,也会通过创建一个新线程来执行该任务,直到已创建的线程数大于或等于corePoolSize时,(除了利用提交新任务来创建和启动线程(按需构造),也可以通过 prestartCoreThread() 或 prestartAllCoreThreads() 方法来提前启动线程池中的基本线程。)
-
maximumPoolSize(线程池总大小):线程池所允许的最大线程个数。当队列满了,且已创建的线程数小于maximumPoolSize,则线程池会创建新的线程来执行任务。另外,对于无界队列,可忽略该参数。
-
BlockingQueue(任务队列):用于传输和保存等待执行任务的阻塞队列
-
handler(线程饱和策略):当线程池和队列都满了,再加入线程会执行此策略。
2、向线程池提交任务
主要的两个方法提交任务:execute()和submit()。
- execute(),提交一个任务,没有返回值。
- submit(),提交一个线程任务,有返回值。
submit(Callable<T> task)能获取到它的返回值,通过future.get()获取(阻塞直到任务执行完才往下执行)。
submit(Runnable task, T result)能通过传入的载体result间接获得线程的返回值。
submit(Runnable task)则是没有返回值的,就算获取它的返回值也是null。
Future.get方法会使取结果的线程进入阻塞状态,知道线程执行完成之后,唤醒取结果的线程,然后返回结果。
为什么任务队列使用阻塞队列?
因为阻塞队列在队列里面是空的时候,如果线程此时还要获取元素,则使得线程进入等待状态,直到线程非空,等待状态可以节约cpu资源。
线程池和生产者消费者设计模式之间的关系
此外,线程池还是生产者消费者的设计模型的实现。所谓生产者消费者模式就是:生产者生产完数据之后,不用等待消费者,而是直接放到阻塞队列里面,消费者消费完上一个,直接到阻塞队列里面取数据。也就是阻塞队列相当于一个缓冲区,可以实现生产者和消费者的解耦。
但是,线程池实际上比这种模式更加高级一点,因为只有当核心线程池满了之后才把任务放到任务队列里面,否则是把任务直接给核心线程池的,而生产者消费者是不管三七二十一,都把任务放到队列里面,因此效率显然会低一些。
参考书籍《java并发编程的艺术》