线程池
合理使用线程池的好处
java的线程是运用场景最多的并发框架,几乎所有需要异步或者并发执行任务的程序都可以使用线程池
合理使用线程池带来的好处
降低资源的消耗
通过重复利用已经创建的线程,降低频繁的创建与销毁线程所带来的资源消耗,例如Worker进程会无限循环从阻塞队列中获取任务执行
提高响应速度
当任务到达时,不需要等到线程创建就可以直接去使用
提高线程的可管理型
线程属于稀缺性资源,线程池可以对线程资源进行统一的调配,优化和监控
线程池的工作流程
一个新的任务到达线程池时,线程池的处理流程如下:
- 线程池判断核心线程是否都在执行任务,如果不是,创建一个新的线程去执行任务,如果核心线程都在执行任务,则进入下一个流程
- 线程池判断阻塞队列是否已满。如果阻塞队列没有满,则将新提交的任务存储在阻塞队列中,如果阻塞队列已满,则进入下一个流程
- 线程池判断线程池中线程是否都处于工作状态(当前线程数量是否小于最大线程数)如果没有,则创建新的线程去执行任务。如果已满,则交给饱和策略处理这个任务
线程池的核心实现类是ThreadPoolExecutor类,用来执行提交的任务。因此,任务提交到线程时,具体的处理流程是由ThreadPoolExecutor类的execute()方法来完成的。
- 如果当前运行的线程小于corePoolSize,则创建新的线程去执行任务(执行这一步骤需要获取全局锁)
- 如果当前运行的大于或者等于corePoolSize,且任务队列(BlockingQueue)未满,则将任务添加到任务队列
- 如果任务队列已满,并且当前线程数量小于maximumPoolSize,则创建新的线程去执行任务(执行这一步骤需要获取全局锁)
- 如果当前线程数量大于或等于maximumPoolSize,任务将被拒绝,并调用RejectExecutionHandler.rejectExcution()方法。即调用饱和策略对任务进行处理。
工作线程
线程池在创建线程的时候,会将线程封装成工作线程Worker。Worker在执行完任务后,不是立即销毁,而是会循环获取任务队列里面的任务去执行。
线程池的创建(7个参数)
可以通过ThreadPoolExecutor来创建一个线程
new ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime,
TimeUnit unit, BlockingQueue<Runnable> workQueue, RejectedExecutionHandler handler)
corePoolSize(线程池基本大小)
- 提交一个任务到线程池时,线程池会创建新的线程去执行任务。注意,即使有空闲的基本线程能执行任务,也会去创建新的线程。
- 如果线程池中的线程数已经大于或者等于corePoolSize,则不会去创建新的线程
- 如果调用了preStartAllCoreThread()方法,线程池会提前创建并启动所有的基本线程
maximumPoolSize(线程池最大数量)线程池允许创建的最大线程数
- 阻塞队列(任务队列)已满,线程数小于maximumPoolSize便可以创建新的线程去执行任务
- 如果使用无界的阻塞队列,那么这个参数没有什么效果
workQueue(工作队列,任务队列,阻塞队列)用于保存等待执行的任务的阻塞队列
- ArrayBlockingQueue:基于数组结构的有界阻塞队列,按照FIFO(先进先出)的原则对任务进行排序,使用该队列,线程池中允许创建的最大线程数为maximumPoolSize
- LinkedBlockingQueue:基于链表结构的无界阻塞队列,按照FIFO(先进先出)的原则对任务进行排序,吞吐量高于ArrayBlockingQueue,使用该队列,线程池中允许创建的最大线程数corePoolSize。静态工厂方法Executor.newFixedThreadPool()使用了这个队列
- SynchronousQueue:一个不存储元素的阻塞队列,添加任务的操作必须等到另外一个线程的移除操作,否则就会一直处于阻塞状态,静态方法Executor.newCachedThreadPool()使用了这个队列
- PriorityBlockingQueue:一个支持优先级的无界阻塞队列,使用该队列,线程池最大线程数为corePoolSize
keepAliveTime(线程活动保持时间):线程池的工作线程空闲后,保持存活的时间,如果任务多而且任务执行的时间短,那么可以调大keepAliveTime,提高线程的利用率
unit(线程活动保持时间的单位):可选的单位为DAYS,HOURS,MINUTES,毫秒,微妙,纳秒
handler(饱和策略,或者又称为拒绝策略):当队列和线程都满了之后,即线程池饱和了,必须采用一种策略处理新提交的任务
- AbortPolicy:无法处理新任务的时候,直接抛出异常,默认策略
- CallerRunsPolicy:用调用者所在的线程来执行任务
- DiscardOldestPolicy:丢弃阻塞线程队列中最靠前的一个任务,并执行当前任务
- DiscardPolicy:直接丢弃任务
threadFactory:构建线程的工厂类
总结
- 常用的5个核心参数,核心池,最大池,空间时间,时间单位,阻塞队列,另外两个:拒绝策略,线程工厂类
- 常见的线程池的创建参数如下:CacheThreadPool核心池为0,最大池为Inter.MAX_VALUE,相当于只使用了最大池,其他线程池,核心池和最大池一样大,因此相当于只使用了核心池
FixedThredPool: new ThreadExcutor(n, n, 0L, ms, new LinkedBlockingQueue<Runable>()
SingleThreadExecutor: new ThreadExcutor(1, 1, 0L, ms, new LinkedBlockingQueue<Runable>())
CachedTheadPool: new ThreadExcutor(0, max_valuem, 60L, s, new SynchronousQueue<Runnable>());
ScheduledThreadPoolExcutor: ScheduledThreadPool, SingleThreadScheduledExecutor.
- 如果使用的阻塞队列为无界队列,那么永远不会调用拒绝队列(饱和策略),因为再多的任务都可以放入队列
- SynchronousQueue是不存储任务的,新的任务要么立即被已有线程执行,要么立即创建新的线程去执行
向线程池提交任务
使用ThreadPoolExecutor.executor()方法来提交任务
public void execute(Runnable command) {
// command为null,抛出NullPointerException
if (command == null)
throw new NullPointerException();
int c = ctl.get();
// 线程池中的线程数小于corePoolSize,创建新的线程
if (workerCountOf(c) < corePoolSize) {
if (addWorker(command, true))// 创建工作线程
return;
c = ctl.get();
}
// 将任务添加到阻塞队列
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
if (! isRunning(recheck) && remove(command))
reject(command);
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}// 阻塞队列已满,尝试创建新的线程,如果超过maximumPoolSize,执行handler.rejectExecution()
else if (!addWorker(command, false))
reject(command);
}
线程池的5种运行状态
RUNNING:该状态技能接受新提交的任务,又能处理阻塞队列中的任务
SHUTDOWN:该状态的线程池不能接受新提交的任务,但是能处理处于任务队列中的任务(政府服务大厅不允许群众拿号了,处理完手头的和排队中任务就下班了)
- 处于RUNNING状态时,调用shutdown()方法会使线程池进入到该状态
- 注意:finalize()方法在执行过程中也会隐式调用shutdown()方法
STOP:该状态既不能接受新的任务,也不会处理处于任务队列中的任务,还会中断正在执行的任务(政府服务大厅不允许群众拿号了,也不处理手头的任务,直接下班了)
- 在线程处于RUNNING或者SHUTDOWN状态时,调用shutdownNow()方法会使线程池进入该状态
TIDYING:如果所有的任务都终止,workerCount(有效线程数)=0
- 线程池进入该状态会调用terminated()钩子方法进入TERMINATED状态
TERMINATED:在调用terminated()钩子方法后会进入该状态,默认terminated()方法什么也没有做
线程池关闭
可以通过调用线程池的shutdown或者shutdownNow方法来关闭线程池:遍历线程池中的工作线程,逐个调用interrupt方法来中断线程
shutdown方法与shutdownNow方法的区别:
- shutdown方法会使线程池的状态设置为SHUTDOWN状态,只会中断空闲的工作线程
- shutdownNow方法会使线程池的状态设置为STOP状态,会中断所有的工作线程,不管是否空闲
- 调用两者的任何一个方法,都会使isShutDown方法返回true,线程池的所有任务都关闭后,isTerminated方法会返回true
- 通常使用shutdown方法来关闭线程,如果不要求任务一定要执行完,则可以调用shutdownNow方法
java线程池的调优以及监控
线程池的调优(线程池的合理配置)
先从以下几个角度分析任务的特性:
- 任务的性质:CPU密集型,IO密集型和混合型任务
- 任务的优先级:高,中,低
- 任务的执行时间:长,中,短
- 任务的依赖性:是否依赖其他资源,如数据库连接
任务性质不同的任务可以用不同规模的线程池分开处理,可以通过Runtime.getRuntime().availableProcessors() 获取当前设备的CPU个数
CPU密集型:尽量可能小的线程,如配置n^cpu+1个的线程池
IO密集型:线程并不是一直在执行任务,则配置尽可能多的线程,如2*N^cpu
混合型任务:
如果可以拆分,则将其拆分为一个CPU密集型和一个IO密集型任务,只要这两个任务执行的时间相差不是很大,那么分解后执行的吞吐率要高于串行执行的吞吐率,如果这两个任务执行的时间相差太多,则没必要进行分解
- 优先级不同的任务可以使用优先级队列 PriorityBlockingQueue 来处理,它可以让优先级高的任务先得到执行。但是,如果一直有高优先级的任务加入到阻塞队列中,那么低优先级的任务可能永远不能执行。
- 执行时间不同的任务可以交给不同规模的线程池来处理,或者也可以使用优先级队列,让执行时间短的任务先执行。
- 依赖数据库连接池的任务,因为线程提交 SQL 后需要等待数据库返回结果,线程数应该设置得较大,这样才能更好的利用 CPU。
- 建议使用有界队列,有界队列能增加系统的稳定性和预警能力。可以根据需要设大一点,比如几千。使用无界队列,线程池的队列就会越来越大,有可能会撑满内存,导致整个系统不可用
线程池的监控
taskCount:线程池需要执行的任务数量,包括已经执行完的、未执行的和正在执行的。
completedTaskCount:线程池在运行过程中已完成的任务数量,completedTaskCount <= taskCount。
largestPoolSize:线程池曾经创建过的最大线程数量,通过这个数据可以知道线程池是否满过。如等于线程池的最大大小,则表示线程池曾经满了。
getPoolSize: 线程池的线程数量。如果线程池不销毁的话,池里的线程不会自动销毁,所以线程池的线程数量只增不减。
getActiveCount:获取活动的线程数。
通过继承线程池并重写线程池的beforeExecute,afterExecute,和terminated方法,我们可以在任务执行前,执行后和线程池关闭时做做一些事
如监控任务的平均执行时间,最大执行时间和最小执行时间,这几个方法在线程池里都是空方法
protected void beforeExecute(Thread t, Runnable r) { }
面试常见问题
1. 讲讲Java的线程池
基础讲解:
- 以ThreadPoolExecutor为切入点,讲解excute()方法中所体现的Java线程池运行流程。
- 工作线程Worker,它的循环工作特点
- 如何新建线程池:7个参数(重点在阻塞队列和饱和策略)
进阶:
-
线程池五个状态的特点以及如何进行状态之间的切换:running、shutdown、stop、tidying、terminated。
-
如何关闭线程:shutdown方法和shutdownNow方法的特点
-
线程池的调优(针对任务的不同特性 + 建议使用有界队列)
-
线程池的监控参数以及可以重写的方法。
-
两种主要的线程池类型:普通的线程池ThreadPoolExecutor,支持延迟或周期性执行的任务的线程池ScheduledThreadPoolExcutor。
-
讲解ThreadPoolExcutor中5个常用参数+2个不常用参数,包含的三种线程池:创建时的参数、运行的流程、各自适合的场景。
-
讲解ScheduledThreadPoolExecutor的阻塞队列的原理、如何更改任务的time。
-
提供了五种定义好的线程池,都可以通过Executors工具类去调用,比如Executors.newFixedThreadPool(12)
2. 具体的场景
如果corePoolSize为x,maximumPoolSize为y,阻塞队列为z,第w个任务进来如何分配?
3. 线程池如何进行调优?
线程池的调优(针对任务的不同特性 + 建议使用有界队列)
4. 线程池中的核心参数
超过核心size怎么处理,队列满怎么处理,拒绝策略有哪些?(比较具体)