文章目录
1. 作用
- 降低资源消耗: 重复利用已创建的线程,降低线程创建和销毁的消耗。
- 提高响应速度: 任务到达时可以不需要等线程创建而是立即就能执行。
- 提高线程的可管理性: 线程是稀缺资源,若无限制创建会消耗系统资源和降低系统稳定性。使用线程池可以进行统一分配、调优和监控。
2. 实现原理
2.1 任务处理流程
当提交一个新任务到线程池,处理流程如下:
- 判断核心线程池里的线程是否都在执行任务。若否,创建一个新的工作线程来执行任务。若是,进入下一流程。
- 判断工作队列是否已满。若否,则将该任务存储在这个工作队列里。若是,则进入下一流程。
- 判断线程池里的线程是否都处于工作状态。若否,则创建新的工作线程来执行任务。若是,用饱和策略来处理这个任务。
2.2 示例:ThreadPoolExecutor 执行execute()方法
如上图,ThreadPoolExecutor 执行execute()方法分为4种情况:
- 如果当前运行的线程少于corePoolSize,则创建新线程来执行任务(执行这一步骤需要获取全局锁)。
- 如果运行的线程等于或多于corePoolSize,则将任务加入BlockingQueue。
- 如果无法将任务加入BlockingQueue(队列已满),则创建新的线程来处理任务(执行这一步骤需要获取全局锁)。
- 如果创建新线程将使当前运行的线程超出maximumPoolSize,任务将被拒绝,并调用RejectedExecutionHandler.rejectedExecution()方法。
采取上述的总体设计思路,是为了执行execute()方法时,尽可能避免获取全局锁。在完成预热之后(当前运行的线程数大于等于corePoolSize),几乎所有execute()方法调用都是执行步骤2。
3. 线程池的使用
3.1 线程池的创建
new ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime, milliseconds, runnableTaskQueue, handler);
参数:
- corePoolSize(线程池基本大小): 当提交一个任务时线程池会创建一个线程来执行任务,即使其他空闲的基本线程能够执行新任务也会创建线程,等到需要执行的任务数大于线程池基本大小时就不再创建。如果调用线程池的prestartAlllCoreThreads() 方法,线程池会提前创建并启动所有基本线程。
- runnableTaskQueue(任务队列): 用于保存等待执行的任务的阻塞队列。可以选择以下几个阻塞队列。
- ArrayBlockingQueue: 一个基于数组结构的有界阻塞队列,元素按FIFO原则排序。
- LinkedBlockingQueue: 一个基于链表结构的阻塞队列,元素按FIFO排序,吞吐量高于ArrayBlockingQueue。静态工厂方法 Executors.newFixedThreadPool()使用了这个队列。
- SynchronousQueue: 一个不存储元素的阻塞队列。每个插入操作必须等到另一个线程调用移除操作,否则插入操作一直处于阻塞状态,吞吐量通常要高于LinkedBlockingQueue,静态工厂方法 Executors.newCachedThreadPool 使用了这个队列。
- PriorityBlockingQueue: 一个具有优先级的无限阻塞队列。
- maximumPoolSize(线程池最大数量): 线程池允许创建的最大线程数。如果队列满了并且已创建线程数小于最大线程数,则线程池会再创建新的线程执行任务。(如果使用了无界的任务队列这个参数就没什么效果)
- ThreadFactory: 用于设置创建线程的工厂,可以通过线程工厂给每个创建出来的线程设置有意义的名字。使用开源框架guava提供的ThreadFactoryBuilder可以快速设置名字: new ThreadFactoryBuilder().setNameFormat(“XX-task-%d”).build();
- RejectedExecutionHandler(饱和策略): 当队列和线程池满了,说明线程池处于饱和状态,必须采取一种策略处理提交的新任务。默认是 AbortPolicy。在JDK1.5中Java线程框架提供了以下4种策略:
- AbortPolicy: 直接抛出异常;
- CallerRunsPolicy: 只用调用者所在线程来运行任务;
- DiscardOldestPolicy: 丢弃队列里最近一个任务,并执行当前任务。
- DiscardPolicy: 不处理,丢弃掉。
△ 可以通过实现 RejectedExecutionHandler接口根据应用场景自定义策略。
- keepAliveTime(线程活动保持时间): 线程池的工作线程空闲后,保持存活的时间(默认是超过核心线程数后,用于处理非核心空闲线程,如果设置了allowCoreThreadTimeOut=true,则核心空闲线程也会被处理)。所以,如果任务很多,并且每个任务执行的时间比较短,可以调大时间,提高线程的利用率。
- TimeUnit(时间单位): 可选值有天(DAYS)、小时(HOURS)、分钟(MINUTES)、毫秒(MILLISECONDS)、微秒(MICROSECONDS)、纳秒(NANOSECONDS)。
3.2 向线程池提交任务
3.2.1 execute() 方法
用于提交不需要返回值的任务,无法判断任务是否被线程执行成功。传入任务为Runnable类的实例。
threadPool.execute(new Runnable(){
@Override
public void run(){
//TODO
}
});
3.2.2 submit() 方法
用于提交需要返回值的任务。返回一个future类型的对象,调用这个future对象的get()方法获取返回值,get() 方法会阻塞当前线程直到任务完成,而使用 get(long timeout, TimeUnit unit) 方法则阻塞当前线程一段时间后立即返回,这时候有可能任务没执行完。
Future<Object> future = executor.submit(hasReturnValueTask);
try{
Object s = future.get();
catch(InterruptedException e) {
//处理中断异常
} catch(ExecutionException e){
//处理无法执行任务异常
} finally{
//关闭线程池
executor.shutdown();
}
3.3 关闭线程池
shutdown 方法 和 shutdownNow 方法,
3.3.1 原理
原理都是遍历线程池中的工作线程,逐个调用线程的 interrupt 方法来中断线程,所以无法响应中断的任务可能永远无法终止。
都会使线程池 isShutdown 方法返回 true。当所有任务都已关闭后,才表示线程池关闭成功,这时调用 isTerminated 方法返回 true。
3.3.2 区别
- shutdownNow 方法: 首先将线程池状态设置为 STOP,然后尝试停止所有正在执行或暂停任务的线程,并返回等待执行任务的列表;
- shutdown 方法: 只将线程池的状态设置成 SHUTDOWN 状态,然后中断所有没有正在执行任务的线程。
3.3.3 使用场景
通常调用 shutdown 方法来关闭线程池,
如果任务不一定要执行完,则可以调用 shutdownNow 方法。
3.4 合理配置线程池
可从以下角度来分析:
- 任务性质: CPU密集型任务、IO密集型任务、混合型任务。
- 任务优先级: 高、中、低。
- 任务执行时间: 长、中、短。
- 任务依赖性: 是否依赖其他系统资源,如数据库连接。
3.4.1 任务性质
性质不同的任务可以用不同规模的线程池分开处理。
- CPU密集型任务应配置尽可能小的线程,如 Ncpu+1 个线程的线程池。
- IO密集型任务由于不是一直在执行任务,则应配置尽可能多的线程,如 2*Ncpu。
- 混合型任务,如果可以拆分,将其拆分成一个CPU密集型任务和一个IO密集型任务,只要这两者执行时间相差不大,分解后吞吐量将高于串行执行的吞吐量。如果相差太大则没必要分解。
通过 Runtime.getRuntime().availableProcessors() 方法获得当前设备的 CPU 个数。
3.4.2 任务优先级
优先级不同的任务,可使用优先级队列 PriorityBlockingQueue 来处理。它可让优先级高的任务先执行。
注意:如果一直有优先级高的任务提交到队列里,那么优先级低的任务可能永远不能执行。
3.4.3 任务执行时间
执行时间不同的任务,可以交给不同规模的线程池处理,或者可以使用优先级队列,让执行时间短的任务先执行。
3.4.4 任务依赖性
依赖数据库连接池的任务,因为线程提交SQL后需要等待数据库返回结果,等待的时间越长,则CPU空闲时间就越长,那么线程数应设置得越长,才能更好利用CPU。
3.4.5 其他建议
建议使用有界队列。增加系统稳定性和预警能力。避免由于意外错误导致任务过度积压撑爆内存而使整个系统不可用。
3.5 线程池的监控
3.5.1 使用线程池参数监控
可通过线程池提供的以下参数进行监控:
- taskCount: 线程池需要执行的任务数量;
- completedTaskCount: 线程池在运行过程中已完成的任务数量,小于等于 taskCount;
- largestPoolSize: 线程池里曾经创建过的最大线程数量。如该数值等于线程池最大大小,则表示线程池曾经满过。
- getActiveCount: 获取活动的线程数。
3.5.2 继承线程池
可通过继承线程池来自定义线程池,重写线程池的 beforeExecute、afterExecute 和 terminated 方法,也可以在任务执行前后和线程池关闭前执行一些代码来进行监控。
这几个方法在线程池中都是空方法。
protected void beforeExecute(Thread t, Runnable r){}