1、为什么要使用线程池
- 降低资源消耗。通过重复利用已创建的线程降低线程创建、销毁线程造成的消耗;
- 提高响应速度。当任务到达时,任务可以不需要等到线程创建就能立即执行;
- 提高线程的可管理性。线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配、调优和监控。
2、构造方法:
public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit,
BlockingQueue<Runnable> workQueue, ThreadFactory threadFactory,
RejectedExecutionHandler handler)
参数说明:
- corePoolSize:核心线程数
- maximumPoolSize:最大线程数
- keepAliveTime:除核心线程以外的线程最大空闲存活时间
- unit:存活时间单位
- workQueue:阻塞队列
- threadFactory:创建线程的工厂,默认是DefaultThreadFactory
- handler:饱和策略
- AbortPolicy:拒绝并抛出异常。默认策略
- CallerRunsPolicy:由调用线程处理该任务
- DiscardPolicy:拒绝但是不抛出异常
- DiscardOldestPolicy:丢弃队列最前面的任务,然后重新尝试执行任务(重复此过程)
3、线程池工作图
- 如果此时线程池中的数量小于corePoolSize,即使线程池中的线程都处于空闲状态,也要创建新的线程来处理被添加的任务;
- 如果此时线程池中的数量等于corePoolSize,但阻塞冲队列workQueue未满,那么任务被放入缓冲队列;
- 如果此时线程池中的数量大于等于corePoolSize,阻塞队列workQueue满,并且线程池中的数量小于maximumPoolSize,创建新的线程来处理被添加的任务;
- 如果此时线程池中的数量大于corePoolSize,缓冲队列workQueue满,并且线程池中的数量等于maximumPoolSize,那么通过 handler所指定的策略来处理此任务;
- 当线程池中的线程数量大于 corePoolSize时,如果某线程空闲时间超过keepAliveTime,线程将被终止。这样,线程池可以动态的调整池中的线程数。
优先级:核心线程 > 阻塞队列 > 最大线程数 > 饱和策略
4、 Executors线程工具类(不推荐使用)
阿里巴巴Java开发手册对线程池的强制要求
// 使用的是LinkedBlockingQueue作为阻塞队列且未指定容量
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>()));
}
// 从上面分析可知,这样的话阻塞队列会是Integer的最大值,可能会堆积大量的请求,从而导致OOM
public LinkedBlockingQueue() {
this(Integer.MAX_VALUE);
}
// 阻塞队列没啥大问题了,但是 maximumPoolSize是Integer的最大值,可能会创建大量的线程,从而导致OOM
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
return new ScheduledThreadPoolExecutor(corePoolSize);
}
public ScheduledThreadPoolExecutor(int corePoolSize) {
super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
new DelayedWorkQueue());
}
5、Runnable和Callable
@FunctionalInterface
public interface Runnable {
public abstract void run();
}
@FunctionalInterface
public interface Callable<V> {
V call() throws Exception;
}
两者都是执行任务需要实现的接口,但是Runnable无返回值,且无法抛出异常,Callable有返回值,且可以抛出异常。
6、方法
- execute():方法用于提交不需要返回值的任务,所以无法判断任务是否被线程池执行成功与否;
- submit() :方法用于提交需要返回值的任务。线程池会返回一个 Future 类型的对象,通过这个Future 对象可以判断任务是否执行成功,并且可以通过 Future 的 get() 方法来获取返回值, get() 方法会阻塞当前线程直到任务完成,而使用 get(long timeout,TimeUnit unit) 方法则会阻塞当前线程一段时间后立即返回,这时候有可能任务没有执行完;
- shutdown() :关闭线程池,线程池的状态变为 SHUTDOWN 。线程池不再接受新任务了,但是队列里的任务得执行完毕;
- shutdownNow(): 关闭线程池,线程的状态变为 STOP 。线程池会终止当前正在运行的任务,并停止处理排队的任务并返回正在等待执行的 List;
- isShutDown(): 当调用 shutdown() 方法后返回为 true;
- isTerminated(): 当调用 shutdown() 方法后,并且所有提交的任务完成后返回为 true。
7、如何判断是 CPU 密集任务还是 IO 密集任务
- CPU 密集型简单理解就是利用 CPU 计算能力的任务比如你在内存中对大量数据进行计算或者排序;
- 涉及到网络读取,文件读取这类都是 IO 密集型,这类任务的特点是 CPU 计算耗费时间相比于等待 IO 操作完成的时间来说很少,大部分时间都花在了等待 IO 操作完成上。