最近研究了下ThreadPoolExecutor,发现还是有些需要琢磨的地方。先把JDK1.6文档搬过来。

一个 ExecutorService,它使用可能的几个池线程之一执行每个提交的任务,通常使用 Executors 工厂方法配置。

线程池可以解决两个不同问题:由于减少了每个任务调用的开销,它们通常可以在执行大量异步任务时提供增强的性能,并且还可以提供绑定和管理资源(包括执行任务集时使用的线程)的方法。每个 ThreadPoolExecutor 还维护着一些基本的统计数据,如完成的任务数。

为了便于跨大量上下文使用,此类提供了很多可调整的参数和扩展钩子 (hook)。但是,强烈建议程序员使用较为方便的 Executors 工厂方法 Executors.newCachedThreadPool()(×××线程池,可以进行自动线程回收)、Executors.newFixedThreadPool(int)(固定大小线程池)和 Executors.newSingleThreadExecutor()(单个后台线程),它们均为大多数使用场景预定义了设置。否则,在手动配置和调整此类时,使用以下指导:

  • 核心和最大池大小

  • ThreadPoolExecutor 将根据 corePoolSize(参见 getCorePoolSize())和 maximumPoolSize(参见 getMaximumPoolSize())设置的边界自动调整池大小。当新任务在方法 execute(java.lang.Runnable) 中提交时,如果运行的线程少于 corePoolSize,则创建新线程来处理请求,即使其他辅助线程是空闲的。如果运行的线程多于 corePoolSize 而少于 maximumPoolSize,则仅当队列满时才创建新线程。如果设置的 corePoolSize 和 maximumPoolSize 相同,则创建了固定大小的线程池。如果将 maximumPoolSize 设置为基本的×××值(如 Integer.MAX_VALUE),则允许池适应任意数量的并发任务。在大多数情况下,核心和最大池大小仅基于构造来设置,不过也可以使用 setCorePoolSize(int)setMaximumPoolSize(int) 进行动态更改。

  • 按需构造

  • 默认情况下,即使核心线程最初只是在新任务到达时才创建和启动的,也可以使用方法 prestartCoreThread()prestartAllCoreThreads() 对其进行动态重写。如果构造带有非空队列的池,则可能希望预先启动线程。

  • 创建新线程

  • 使用 ThreadFactory 创建新线程。如果没有另外说明,则在同一个 ThreadGroup 中一律使用 Executors.defaultThreadFactory() 创建线程,并且这些线程具有相同的 NORM_PRIORITY 优先级和非守护进程状态。通过提供不同的 ThreadFactory,可以改变线程的名称、线程组、优先级、守护进程状态,等等。如果从 newThread 返回 null 时 ThreadFactory 未能创建线程,则执行程序将继续运行,但不能执行任何任务。

  • 保持活动时间

  • 如果池中当前有多于 corePoolSize 的线程,则这些多出的线程在空闲时间超过 keepAliveTime 时将会终止(参见 getKeepAliveTime(java.util.concurrent.TimeUnit))。这提供了当池处于非活动状态时减少资源消耗的方法。如果池后来变得更为活动,则可以创建新的线程。也可以使用方法 setKeepAliveTime(long, java.util.concurrent.TimeUnit) 动态地更改此参数。使用 Long.MAX_VALUE TimeUnit.NANOSECONDS 的值在关闭前有效地从以前的终止状态禁用空闲线程。默认情况下,保持活动策略只在有多于 corePoolSizeThreads 的线程时应用。但是只要 keepAliveTime 值非 0,allowCoreThreadTimeOut(boolean) 方法也可将此超时策略应用于核心线程。

  • 排队

  • 所有 BlockingQueue 都可用于传输和保持提交的任务。可以使用此队列与池大小进行交互:

    排队有三种通用策略:

    • 如果运行的线程少于 corePoolSize,则 Executor 始终首选添加新的线程,而不进行排队。

    • 如果运行的线程等于或多于 corePoolSize,则 Executor 始终首选将请求加入队列,而不添加新的线程。

    • 如果无法将请求加入队列,则创建新的线程,除非创建此线程超出 maximumPoolSize,在这种情况下,任务将被拒绝。

  1. 直接提交。工作队列的默认选项是 SynchronousQueue,它将任务直接提交给线程而不保持它们。在此,如果不存在可用于立即运行任务的线程,则试图把任务加入队列将失败,因此会构造一个新的线程。此策略可以避免在处理可能具有内部依赖性的请求集时出现锁。直接提交通常要求××× maximumPoolSizes 以避免拒绝新提交的任务。当命令以超过队列所能处理的平均数连续到达时,此策略允许×××线程具有增长的可能性。

  2. ×××队列。使用×××队列(例如,不具有预定义容量的 LinkedBlockingQueue)将导致在所有 corePoolSize 线程都忙时新任务在队列中等待。这样,创建的线程就不会超过 corePoolSize。(因此,maximumPoolSize 的值也就无效了。)当每个任务完全独立于其他任务,即任务执行互不影响时,适合于使用×××队列;例如,在 Web 页服务器中。这种排队可用于处理瞬态突发请求,当命令以超过队列所能处理的平均数连续到达时,此策略允许×××线程具有增长的可能性。

  3. 有界队列。当使用有限的 maximumPoolSizes 时,有界队列(如 ArrayBlockingQueue)有助于防止资源耗尽,但是可能较难调整和控制。队列大小和最大池大小可能需要相互折衷:使用大型队列和小型池可以最大限度地降低 CPU 使用率、操作系统资源和上下文切换开销,但是可能导致人工降低吞吐量。如果任务频繁阻塞(例如,如果它们是 I/O 边界),则系统可能为超过您许可的更多线程安排时间。使用小型队列通常要求较大的池大小,CPU 使用率较高,但是可能遇到不可接受的调度开销,这样也会降低吞吐量。

被拒绝的任务当 Executor 已经关闭,并且 Executor 将有限边界用于最大线程和工作队列容量,且已经饱和时,在方法 execute(java.lang.Runnable) 中提交的新任务将被拒绝。在以上两种情况下,execute 方法都将调用其 RejectedExecutionHandler 的 RejectedExecutionHandler.rejectedExecution(java.lang.Runnable, java.util.concurrent.ThreadPoolExecutor) 方法。下面提供了四种预定义的处理程序策略:定义和使用其他种类的 RejectedExecutionHandler 类也是可能的,但这样做需要非常小心,尤其是当策略仅用于特定容量或排队策略时。
  1. 在默认的 ThreadPoolExecutor.AbortPolicy 中,处理程序遭到拒绝将抛出运行时 RejectedExecutionException

  2. ThreadPoolExecutor.CallerRunsPolicy 中,线程调用运行该任务的 execute 本身。此策略提供简单的反馈控制机制,能够减缓新任务的提交速度。

  3. ThreadPoolExecutor.DiscardPolicy 中,不能执行的任务将被删除。

  4. ThreadPoolExecutor.DiscardOldestPolicy 中,如果执行程序尚未关闭,则位于工作队列头部的任务将被删除,然后重试执行程序(如果再次失败,则重复此过程)。

钩子 (hook) 方法此类提供 protected 可重写的 beforeExecute(java.lang.Thread, java.lang.Runnable) 和 afterExecute(java.lang.Runnable, java.lang.Throwable) 方法,这两种方法分别在执行每个任务之前和之后调用。它们可用于操纵执行环境;例如,重新初始化 ThreadLocal、搜集统计信息或添加日志条目。此外,还可以重写方法 terminated() 来执行 Executor 完全终止后需要完成的所有特殊处理。如果钩子 (hook) 或回调方法抛出异常,则内部辅助线程将依次失败并突然终止。队列维护方法 getQueue() 允许出于监控和调试目的而访问工作队列。强烈反对出于其他任何目的而使用此方法。remove(java.lang.Runnable) 和 purge() 这两种方法可用于在取消大量已排队任务时帮助进行存储回收。终止程序 AND 不再引用的池没有剩余线程会自动 shutdown。如果希望确保回收取消引用的池(即使用户忘记调用 shutdown()),则必须安排未使用的线程最终终止:设置适当保持活动时间,使用 0 核心线程的下边界和/或设置 allowCoreThreadTimeOut(boolean)。  
使用SynchronousQueue作为线程池中的队列
package com.jzli.threadPool;

import java.util.LinkedList;
import java.util.List;
import java.util.concurrent.Future;
import java.util.concurrent.SynchronousQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

import org.apache.log4j.Logger;

import com.jzli.threadPool.task.SleepTask;

/**
 * 测试使用SynchronousQueue的ThreadPoolExecutor线程池(Executors.newCachedThreadPool())。
 * 测试结果:将最大线程数设置为Integer.MAX_VALUE,则每一个任务创建一个新的线程执行,并且测试发现线程不会被销毁。
 * 测试结论:不建议使用,会造成资源的浪费 。
 * 
 * 官方文档说明:直接提交。工作队列的默认选项是 SynchronousQueue,它将任务直接提交给线程而不保持它们。
 * 在此,如果不存在可用于立即运行任务的线程,则试图把任务加入队列将失败,因此会构造一个新的线程
 * 。此策略可以避免在处理可能具有内部依赖性的请求集时出现锁。直接提交通常要求××× maximumPoolSizes
 * 以避免拒绝新提交的任务。当命令以超过队列所能处理的平均数连续到达时,此策略允许×××线程具有增长的可能性。
 * 
 * @author lijinzhao
 * 
 */
public class ThreadPoolExecutorTestWithSynchronousQueue {
	private static final Logger _log = Logger
			.getLogger(ThreadPoolExecutorTestWithSynchronousQueue.class);

	public static void main(String[] args) throws Exception {
		new ThreadPoolExecutorTestWithSynchronousQueue().test();
	}

	public void test() throws Exception {
		ThreadPoolExecutor threadPool = null;

		// 使用SynchronousQueue队列,为不断创建新的线程来完成任务,并会在自动销毁线程(???实验中并未自动销毁)
		threadPool = new ThreadPoolExecutor(0, Integer.MAX_VALUE, 1800,
				TimeUnit.SECONDS, new SynchronousQueue<Runnable>(),
				new ThreadPoolExecutor.DiscardOldestPolicy());

		// threadPool = new ThreadPoolExecutor(coreSize, maxSize, 30L,
		// TimeUnit.SECONDS, new ArrayBlockingQueue<Runnable>(300),
		// new ThreadPoolExecutor.DiscardOldestPolicy());

		// threadPool = (ThreadPoolExecutor) Executors.newCachedThreadPool();
		List<Future<Integer>> list = new LinkedList<Future<Integer>>();
		for (int i = 1; i <= 500; i++) {
			list.add(threadPool.submit(new SleepTask(i), i));
		}

		int count = 0;
		do {
			count = threadPool.getActiveCount();
			TimeUnit.SECONDS.sleep(1);
		} while (count > 0);

		for (Future<Integer> future : list) {
			try {
				_log.info("result=" + future.get());
			} catch (Exception e) {
				_log.error(e, e);
			}
		}
		_log.info(threadPool.getPoolSize());
		TimeUnit.SECONDS.sleep(60);
		_log.info("=====================================");
		_log.info(threadPool.getPoolSize());

		list = new LinkedList<Future<Integer>>();
		for (int i = 1; i <= 100; i++) {
			list.add(threadPool.submit(new SleepTask(i), i));
		}

		count = 0;
		do {
			count = threadPool.getActiveCount();
			TimeUnit.SECONDS.sleep(1);
		} while (count > 0);

		_log.info(threadPool.getPoolSize());
		threadPool.shutdown();

		for (Future<Integer> future : list) {
			try {
				_log.info("result=" + future.get());
			} catch (Exception e) {
				_log.error(e, e);
			}
		}
	}

}
使用×××队列作为线程池中的队列
package com.jzli.threadPool;

import java.util.LinkedList;
import java.util.List;
import java.util.concurrent.Future;
import java.util.concurrent.LinkedBlockingQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

import org.apache.log4j.Logger;

import com.jzli.threadPool.task.SleepTask;

/**
 * 测试使用LinkedBlockingQueue×××队列,作为任务接收队列时 。 测试结果:不创建新的线程,最大线程数不起作用,始终只有核心线程数的线程。
 * 测试结论:不建议使用
 * 
 * 
 * 官方文档说明:×××队列。使用×××队列(例如,不具有预定义容量的 LinkedBlockingQueue)将导致在所有 corePoolSize
 * 线程都忙时新任务在队列中等待。这样,创建的线程就不会超过 corePoolSize。(因此,maximumPoolSize
 * 的值也就无效了。)当每个任务完全独立于其他任务,即任务执行互不影响时,适合于使用×××队列;例如,在 Web
 * 页服务器中。这种排队可用于处理瞬态突发请求,当命令以超过队列所能处理的平均数连续到达时,此策略允许×××线程具有增长的可能性。
 * 
 * @author lijinzhao
 * 
 */
public class ThreadPoolExecutorTestWithLinkedBlockingQueue {
	private static final Logger _log = Logger
			.getLogger(ThreadPoolExecutorTestWithLinkedBlockingQueue.class);

	public static void main(String[] args) throws Exception {
		new ThreadPoolExecutorTestWithLinkedBlockingQueue().test();
	}

	private int coreSize = 10;
	private int maxSize = 100;

	public void test() throws Exception {
		ThreadPoolExecutor threadPool = null;
		// 使用有界队列时,当任务数大于核心线程数加上队列大小时,线程池才会创建新的线程执行任务,但此时拒绝任务的处理程序也会拒绝掉一部分的任务
		threadPool = new ThreadPoolExecutor(coreSize, maxSize, 30L,
				TimeUnit.SECONDS, new LinkedBlockingQueue<Runnable>(),
				new ThreadPoolExecutor.DiscardOldestPolicy());

		List<Future<Integer>> list = new LinkedList<Future<Integer>>();
		for (int i = 1; i <= 500; i++) {
			list.add(threadPool.submit(new SleepTask(i), i));
		}

		int count = 0;
		do {
			count = threadPool.getActiveCount();
			_log.info(threadPool.getPoolSize());
			TimeUnit.SECONDS.sleep(1);
		} while (count > 0);

		for (Future<Integer> future : list) {
			try {
				_log.info("result=" + future.get());
			} catch (Exception e) {
				_log.error(e, e);
			}
		}

		_log.info(threadPool.getPoolSize());
		TimeUnit.SECONDS.sleep(60);
		_log.info("=====================================");
		_log.info(threadPool.getPoolSize());

		list = new LinkedList<Future<Integer>>();
		for (int i = 1; i <= 100; i++) {
			list.add(threadPool.submit(new SleepTask(i), i));
		}

		count = 0;
		do {
			count = threadPool.getActiveCount();
			TimeUnit.SECONDS.sleep(1);
		} while (count > 0);

		_log.info(threadPool.getPoolSize());
		threadPool.shutdown();

		_log.info(threadPool.getPoolSize());
		for (Future<Integer> future : list) {
			try {
				_log.info("result=" + future.get());
			} catch (Exception e) {
				_log.error(e, e);
			}
		}
	}

}

使用有界队列作为线程池中的队列

package com.jzli.threadPool;

import java.util.LinkedList;
import java.util.List;
import java.util.concurrent.Future;
import java.util.concurrent.LinkedBlockingQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

import org.apache.log4j.Logger;

import com.jzli.threadPool.task.SleepTask;

/**
 * 测试使用ArrayBlockingQueue或者LinkedBlockingQueue有界队列,作为任务接收队列时 测试结果:
 * 1.当任务数大于核心线程数加上队列大小时
 * ,线程池才会创建新的线程执行任务,但此时如果最大线程数不足时,线程池会因为最大线程个数和队列的大小有限而使用拒绝任务处理程序拒绝掉一部分的任务。
 * 2.当队列数足够大时,则不会创建新的线程,而只使用核心线程来执行任务,这种情况下会导致任务执行缓慢 。
 * 3.当任务数大于队列大小与核心线程数之和时,线程池才会创建新的线程执行任务,如果最大线程数足够时,可以保住所有任务的快速正确完成。
 * 测试结论:建议使用,建议设置最大线程数足够大
 * (3000),队列大小为一定数量(100),核心线程数为一定数量(100),保存时间为1800秒,同时发现创建线程时的命名规则好像是一直往上加的。
 * 
 * 官方文档说明:有界队列。当使用有限的 maximumPoolSizes 时,有界队列(如
 * ArrayBlockingQueue)有助于防止资源耗尽,但是可能较难调整和控制
 * 。队列大小和最大池大小可能需要相互折衷:使用大型队列和小型池可以最大限度地降低 CPU
 * 使用率、操作系统资源和上下文切换开销,但是可能导致人工降低吞吐量。如果任务频繁阻塞(例如,如果它们是 I/O
 * 边界),则系统可能为超过您许可的更多线程安排时间。使用小型队列通常要求较大的池大小,CPU
 * 使用率较高,但是可能遇到不可接受的调度开销,这样也会降低吞吐量。
 * 
 * @author lijinzhao
 * 
 */
public class ThreadPoolExecutorTestWithArrayBlockingQueue {
	private static final Logger _log = Logger
			.getLogger(ThreadPoolExecutorTestWithArrayBlockingQueue.class);

	public static void main(String[] args) throws Exception {
		new ThreadPoolExecutorTestWithArrayBlockingQueue().test();
	}

	private int coreSize = 100;
	private int maxSize = 3000;
	private int queueSize = 100;

	public void test() throws Exception {
		ThreadPoolExecutor threadPool = null;
		// 使用有界队列时,当任务数大于核心线程数加上队列大小时,线程池才会创建新的线程执行任务,但此时拒绝任务的处理程序也会拒绝掉一部分的任务
		threadPool = new ThreadPoolExecutor(coreSize, maxSize, 30L,
				TimeUnit.SECONDS, new LinkedBlockingQueue<Runnable>(queueSize),
				new ThreadPoolExecutor.CallerRunsPolicy());

		List<Future<Integer>> list = new LinkedList<Future<Integer>>();
		for (int i = 1; i <= 500; i++) {
			list.add(threadPool.submit(new SleepTask(i), i));
		}

		int count = 0;
		do {
			count = threadPool.getActiveCount();
			TimeUnit.SECONDS.sleep(1);
		} while (count > 0);

		for (Future<Integer> future : list) {
			try {
				_log.info("result=" + future.get());
			} catch (Exception e) {
				_log.error(e, e);
			}
		}
		// 获取池中的当前线程数
		_log.info(threadPool.getPoolSize());
		TimeUnit.SECONDS.sleep(60);
		_log.info("=====================================");
		// 获取池中的当前线程数
		_log.info(threadPool.getPoolSize());

		list = new LinkedList<Future<Integer>>();
		for (int i = 1; i <= 100; i++) {
			list.add(threadPool.submit(new SleepTask(i), i));
		}

		count = 0;
		do {
			count = threadPool.getActiveCount();
			TimeUnit.SECONDS.sleep(1);
		} while (count > 0);

		// 获取池中的当前线程数
		_log.info(threadPool.getPoolSize());
		threadPool.shutdown();

		for (Future<Integer> future : list) {
			try {
				_log.info("result=" + future.get());
			} catch (Exception e) {
				_log.error(e, e);
			}
		}
	}

}
package com.jzli.threadPool.task;

import java.util.concurrent.TimeUnit;

import org.apache.log4j.Logger;

/**
 * 打印序号,并休眠一秒钟
 * 
 * @author lijinzhao
 * 
 */
public class SleepTask implements Runnable {
	private static final Logger _log = Logger.getLogger(SleepTask.class);
	private int i;

	public SleepTask(int i) {
		super();
		this.i = i;
	}

	@Override
	public void run() {
		try {
			_log.info(i);
			TimeUnit.SECONDS.sleep(1);
		} catch (InterruptedException e) {
			_log.error(e, e);
		}
	}

}


测试结论:建议使用有界队列作为线程池中的队列,将核心线程数设置为中等大小的数字(100),将最大线程数设置为比较大的数字(3000),将队列容量设置为中等大小的数字(1000),线程保持时间设置为一个比较长的时间(1800秒),防止线程的反复创建和销毁。