重读Java并发编程艺术(8) -Java线程池

1. 作用

  • 降低资源消耗: 重复利用已创建的线程,降低线程创建和销毁的消耗。
  • 提高响应速度: 任务到达时可以不需要等线程创建而是立即就能执行。
  • 提高线程的可管理性: 线程是稀缺资源,若无限制创建会消耗系统资源和降低系统稳定性。使用线程池可以进行统一分配、调优和监控。

2. 实现原理

2.1 任务处理流程

当提交一个新任务到线程池,处理流程如下:

  1. 判断核心线程池里的线程是否都在执行任务。若否,创建一个新的工作线程来执行任务。若是,进入下一流程。
  2. 判断工作队列是否已满。若否,则将该任务存储在这个工作队列里。若是,则进入下一流程。
  3. 判断线程池里的线程是否都处于工作状态。若否,则创建新的工作线程来执行任务。若是,用饱和策略来处理这个任务。
    在这里插入图片描述

2.2 示例:ThreadPoolExecutor 执行execute()方法

在这里插入图片描述
如上图,ThreadPoolExecutor 执行execute()方法分为4种情况:

  1. 如果当前运行的线程少于corePoolSize,则创建新线程来执行任务(执行这一步骤需要获取全局锁)。
  2. 如果运行的线程等于或多于corePoolSize,则将任务加入BlockingQueue。
  3. 如果无法将任务加入BlockingQueue(队列已满),则创建新的线程来处理任务(执行这一步骤需要获取全局锁)。
  4. 如果创建新线程将使当前运行的线程超出maximumPoolSize,任务将被拒绝,并调用RejectedExecutionHandler.rejectedExecution()方法。

采取上述的总体设计思路,是为了执行execute()方法时,尽可能避免获取全局锁。在完成预热之后(当前运行的线程数大于等于corePoolSize),几乎所有execute()方法调用都是执行步骤2。

3. 线程池的使用

3.1 线程池的创建

new ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime, milliseconds, runnableTaskQueue, handler);

参数:

  • corePoolSize(线程池基本大小): 当提交一个任务时线程池会创建一个线程来执行任务,即使其他空闲的基本线程能够执行新任务也会创建线程,等到需要执行的任务数大于线程池基本大小时就不再创建。如果调用线程池的prestartAlllCoreThreads() 方法,线程池会提前创建并启动所有基本线程。
  • runnableTaskQueue(任务队列): 用于保存等待执行的任务的阻塞队列。可以选择以下几个阻塞队列。
    • ArrayBlockingQueue: 一个基于数组结构的有界阻塞队列,元素按FIFO原则排序。
    • LinkedBlockingQueue: 一个基于链表结构的阻塞队列,元素按FIFO排序,吞吐量高于ArrayBlockingQueue。静态工厂方法 Executors.newFixedThreadPool()使用了这个队列。
    • SynchronousQueue: 一个不存储元素的阻塞队列。每个插入操作必须等到另一个线程调用移除操作,否则插入操作一直处于阻塞状态,吞吐量通常要高于LinkedBlockingQueue,静态工厂方法 Executors.newCachedThreadPool 使用了这个队列。
    • PriorityBlockingQueue: 一个具有优先级的无限阻塞队列。
  • maximumPoolSize(线程池最大数量): 线程池允许创建的最大线程数。如果队列满了并且已创建线程数小于最大线程数,则线程池会再创建新的线程执行任务。(如果使用了无界的任务队列这个参数就没什么效果)
  • ThreadFactory: 用于设置创建线程的工厂,可以通过线程工厂给每个创建出来的线程设置有意义的名字。使用开源框架guava提供的ThreadFactoryBuilder可以快速设置名字: new ThreadFactoryBuilder().setNameFormat(“XX-task-%d”).build();
  • RejectedExecutionHandler(饱和策略): 当队列和线程池满了,说明线程池处于饱和状态,必须采取一种策略处理提交的新任务。默认是 AbortPolicy。在JDK1.5中Java线程框架提供了以下4种策略:
    • AbortPolicy: 直接抛出异常;
    • CallerRunsPolicy: 只用调用者所在线程来运行任务;
    • DiscardOldestPolicy: 丢弃队列里最近一个任务,并执行当前任务。
    • DiscardPolicy: 不处理,丢弃掉。

△ 可以通过实现 RejectedExecutionHandler接口根据应用场景自定义策略。

  • keepAliveTime(线程活动保持时间): 线程池的工作线程空闲后,保持存活的时间(默认是超过核心线程数后,用于处理非核心空闲线程,如果设置了allowCoreThreadTimeOut=true,则核心空闲线程也会被处理)。所以,如果任务很多,并且每个任务执行的时间比较短,可以调大时间,提高线程的利用率。
  • TimeUnit(时间单位): 可选值有天(DAYS)、小时(HOURS)、分钟(MINUTES)、毫秒(MILLISECONDS)、微秒(MICROSECONDS)、纳秒(NANOSECONDS)。

3.2 向线程池提交任务

3.2.1 execute() 方法

用于提交不需要返回值的任务,无法判断任务是否被线程执行成功。传入任务为Runnable类的实例。

threadPool.execute(new Runnable(){
	@Override
	public void run(){
		//TODO
	}
});

3.2.2 submit() 方法

用于提交需要返回值的任务。返回一个future类型的对象,调用这个future对象的get()方法获取返回值,get() 方法会阻塞当前线程直到任务完成,而使用 get(long timeout, TimeUnit unit) 方法则阻塞当前线程一段时间后立即返回,这时候有可能任务没执行完。

Future<Object> future = executor.submit(hasReturnValueTask);
try{
	Object s = future.get();
catch(InterruptedException e)	{
	//处理中断异常
} catch(ExecutionException e){
	//处理无法执行任务异常
} finally{
	//关闭线程池
	executor.shutdown();
}

3.3 关闭线程池

shutdown 方法shutdownNow 方法

3.3.1 原理

原理都是遍历线程池中的工作线程,逐个调用线程的 interrupt 方法来中断线程,所以无法响应中断的任务可能永远无法终止。
都会使线程池 isShutdown 方法返回 true。当所有任务都已关闭后,才表示线程池关闭成功,这时调用 isTerminated 方法返回 true。

3.3.2 区别

  • shutdownNow 方法: 首先将线程池状态设置为 STOP,然后尝试停止所有正在执行或暂停任务的线程,并返回等待执行任务的列表;
  • shutdown 方法: 只将线程池的状态设置成 SHUTDOWN 状态,然后中断所有没有正在执行任务的线程。

3.3.3 使用场景

通常调用 shutdown 方法来关闭线程池,
如果任务不一定要执行完,则可以调用 shutdownNow 方法。

3.4 合理配置线程池

可从以下角度来分析:

  • 任务性质: CPU密集型任务、IO密集型任务、混合型任务。
  • 任务优先级: 高、中、低。
  • 任务执行时间: 长、中、短。
  • 任务依赖性: 是否依赖其他系统资源,如数据库连接。

3.4.1 任务性质

性质不同的任务可以用不同规模的线程池分开处理。

  • CPU密集型任务应配置尽可能小的线程,如 Ncpu+1 个线程的线程池。
  • IO密集型任务由于不是一直在执行任务,则应配置尽可能多的线程,如 2*Ncpu
  • 混合型任务,如果可以拆分,将其拆分成一个CPU密集型任务和一个IO密集型任务,只要这两者执行时间相差不大,分解后吞吐量将高于串行执行的吞吐量。如果相差太大则没必要分解。

通过 Runtime.getRuntime().availableProcessors() 方法获得当前设备的 CPU 个数。

3.4.2 任务优先级

优先级不同的任务,可使用优先级队列 PriorityBlockingQueue 来处理。它可让优先级高的任务先执行。
注意:如果一直有优先级高的任务提交到队列里,那么优先级低的任务可能永远不能执行。

3.4.3 任务执行时间

执行时间不同的任务,可以交给不同规模的线程池处理,或者可以使用优先级队列,让执行时间短的任务先执行。

3.4.4 任务依赖性

依赖数据库连接池的任务,因为线程提交SQL后需要等待数据库返回结果,等待的时间越长,则CPU空闲时间就越长,那么线程数应设置得越长,才能更好利用CPU。

3.4.5 其他建议

建议使用有界队列。增加系统稳定性和预警能力。避免由于意外错误导致任务过度积压撑爆内存而使整个系统不可用。

3.5 线程池的监控

3.5.1 使用线程池参数监控

可通过线程池提供的以下参数进行监控:

  • taskCount: 线程池需要执行的任务数量;
  • completedTaskCount: 线程池在运行过程中已完成的任务数量,小于等于 taskCount;
  • largestPoolSize: 线程池里曾经创建过的最大线程数量。如该数值等于线程池最大大小,则表示线程池曾经满过。
  • getActiveCount: 获取活动的线程数。

3.5.2 继承线程池

可通过继承线程池来自定义线程池,重写线程池的 beforeExecute、afterExecute 和 terminated 方法,也可以在任务执行前后和线程池关闭前执行一些代码来进行监控。
这几个方法在线程池中都是空方法。

protected void beforeExecute(Thread t, Runnable r){}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值