一、线程池的基础知识
创建线程需要占用一定的操作系统资源,在高并发情况下,频繁的创建和销毁线程会大量消耗CPU和内存资源,对程序性能造成很大的影响。为了避免这一问题,Java提供了线程池(通过线程复用,减少了频繁创建和销毁线程的开销)。
1、线程池的生命周期
线程池从诞生到死亡,会经历五种生命周期:RUNNING、SHUTDOWN、STOP、TIDYING、TERMINATED
RUNNING:表示线程池处于运行状态,能够接受新提交的任务且能对已添加的任务进行处理,RUNNING状态是线程池的初始状态,线程池一旦被创建就处于RUNNING状态。
SHUTDOWN:线程处于关闭状态,不接受新任务,但可以处理已添加的任务,RUNNING状态的线程池调用shutdown方法就进入SHUTDOWN状态。
STOP:线程池处于停止状态,不接收任务,不处理已添加的任务,且会中断正在执行任务的线程。RUNNING状态的线程池调用了shutdownNow后会进入STOP状态。
TIDYING:当所有任务已终止,且任务数量为0时,线程池会进入TIDYING。当线程池处于SHUTDOWN时,阻塞队列中的任务执行完了,且线程池中没有正在运行的任务,状态会由SHUTDOWN变成TIDYING。当线程处于STOP状态时,线程池中没有正在执行的任务时则会由STOP变为TIDYING。
TERMINATED:线程终止状态。处于TIDYING状态的线程执行terminated()后进入TERMINATED状态。
如下所示的线程池生命周期状态流程示意图:
二、线程池的参数
从源码中可以看出,线程池一共有7个参数
1、corePoolSize:线程池核心线程数
线程池中会维护一个最小的线程数量,即使这些线程处于空闲状态,他们也不会销毁,除非设置了allowCoreThreadTimeOut,这里的最小线程数量就是corePoolSize。
2、maximumPoolSize:线程池最大线程数
线程池不会无限制的去创建新线程,它会有一个最大线程数量的限制,这个数量即由maximunPoolSize指定
3、keepAliveTime:空闲线程存活时间
一个线程如果处于空闲状态,并且当前的线程数量大于corePoolSize,那么在指定时间后,这个空闲线程会被销毁,这里的指定时间由keepAliveTime来设定。
4、unit:空闲线程存活时间单位
5、workQueue:工作队列
新任务被提交后,会先进入到此工作队列中,任务调度时再从队列中取出任务。jdk中提供了四种工作队列:
①、ArrayBlockingQueue
基于数组的有界阻塞队列,先进先出,新任务进来,会放到该队列的尾部,有界的队列可以防止资源耗尽的问题。当线程池中线程数量达到corePoolSize后,再有新的任务进来,则会把任务放到队列的尾部,等待被调度。如果队列满了,则会创建一个新的线程,如果线程数量达到maximumPoolSize,则会执行拒绝策略。
②、LinkedBlockingQueue
基于链表的无界阻塞队列(其实最大容量为Interger.MAX),先进先出,由于该队列的近似无界性,当线程池中线程数量达到corePoolSize后,再有新的任务进来,会一直放入该队列,而不会创建新的线程直到maximumPoolSize,因此使用该工作队列时,参数maxPoolSize是不起作用的。
③、SynchronousQuene
一个不缓存任务的阻塞队列。也就是说,新任务进来时,不会缓存,直接被调度执行,如果没有可用线程,则创建新的线程,如果线程数量达到maximumPoolSize,则会执行拒绝策略。
④、PriorityBlockingQueue
具有优先级的有界阻塞队列,指定构造参数Comparator来对元素进行排序。
6、threadFactory: 线程工厂
创建一个新线程时使用的工厂,可以用来设定线程名、是否为daemon线程等等
7、handler:拒绝策略
当工作队列中的任务已到达最大限制,并且线程池中的线程数量也达到最大限制,这时如果有新任务提交进来,该如何处理呢。这里的拒绝策略,就是解决这个问题的,jdk中提供了4种拒绝策略:
①、CallerRunsPolicy
该策略下,在调用者线程中直接执行被拒绝任务的run方法,除非线程已经shutdown,则直接抛弃任务。
②、AbortPolicy
该策略下,直接丢弃任务,并抛出RejectedExecutionException异常。
③、DiscardPolicy
该策略下,直接丢弃任务,什么都不做
④、DiscardOldestPolicy
该策略下,抛弃最早进入队列的那个任务,然后尝试把这次拒绝的任务加入队列
三、线程池执行流程
1、当execute方法提交一个任务时,如果线程池中线程数小于corePoolSize,那么不管线程池中是否有空闲线程,都会创建一个新的线程去执行该任务。
2、当execute方法提交一个任务时,如果线程池中的线程数已经达到corePoolSize,且此时没有空闲线程,那么该任务会存储到队列中,如果工作队列已满,则会创建一个新的线程来执行任务,但总线程数应该小于maximumPoolSize。如果线程池中的线程数达到了maximumPoolSize,且队列已满,此时会执行拒绝策略来拒绝接受任务。
3、如果线程池中的线程数超过了corePoolSize,那么空闲时间超过keepAliveTime的线程会被销毁,但程池中线程个数会保持为corePoolSize。
4、如果线程池存在空闲的线程,并且设置了allowCoreThreadTimeOut为true。那么空闲时间超过keepAliveTime的线程都会被销毁。
四、常见的线程池
1、newCachedThreadPool
可缓存线程池,如果线程池长度超过处理需要,可灵活回收线程,如果线程不足,可创建新的线程
2、newFixedThreadPool
固定长度线程池,可控制线程最大并发数,超出的线程会在队列中等待。
3、newScheduledThreadPool
它的核心线程数量是固定的,而非核心线程数是没有限制的,并且当非核心线程闲置时会被立即回收,它可安排给定延迟后运行命令或者定期地执行。这类线程池主要用于执行定时任务和具有固定周期的重复任务。
4、newSingleThreadExecutor 单线程的线程池
线程池内部只有一个核心线程,以无界队列方式来执行该线程
线程池核心线程为什么一直存活?
线程池之所以能做到线程重复利用,是因为线程池的核心线程不被摧毁,执行完任务后重复利用。
先看下线程池的工作原理:
- 客户端创建线程池对象后,调用execute方法提交一个runnable任务。
- execute方法内会调用addWorker方法创建一个Worker对象。(这个Worker继承了AQS,实现了Runnable)
- addWorker方法内会调用Worker.thread.start方法,也就是Worker对象的run方法。
- 这个run方法会委托给runWorker方法执行。
- runWorker方法内有while循环,不断调用getTask方法获取任务。
- getTask方法通过阻塞队列的take方法来获取队列中的任务,如果队列为空,则一直阻塞当前线程。
因此,线程池是通过阻塞队列的take方法来阻塞核心线程Worker的run方法,保证核心线程不会因执行完run方法而终止