1.为什么使用线程池
线程池做的工作主要是控制运行中线程的数量,处理过程中将任务放入队列,然后在线程创建后启动这些任务,如果线程数量超过了最大数量,超出数量的线程排队等候,等其他线程执行完毕,在从队列中执行。
线程池主要的特点:线程复用;控制最大并发数;管理线程;
优势:
1.降低资源消耗,通过重复利用已创建的线程降低线程创建和销毁造成的消耗;
2.提高响应速度。当任务到达时,任务可以不需要的等到线程创建就能立即执行。
3.提高线程的可管理性。线程是稀缺资源,如果无限制的创建,不仅消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,调优和监控。
2.常见的创建线程池方式
1.newFixedThreadPool:创建一个固定数量的线程池,例如下面的例子中一池5个线程;
ExecutorService threadPool = Executors.newFixedThreadPool(5);
实现方式:
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
这种线程池主要特点:
1.创建一个定长线程池,可以控制线程最大并发数,超出的线程会在队列中等待;
2.newFixedThreadPool创建线程池corePoolSize和maximumPoolSize值是相等的,使用的是LinkedBlockingQueue堵塞队列;
适用于:执行长期的任务,性能好很好;
2.newSingleThreadExecutor:创建一个线程的线程池
//一池一个线程
ExecutorService threadPool = Executors.newSingleThreadExecutor();
//底层实现
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>()));
}
主要特点:
1.创建一个单线程化的线程池,它只会用唯一的工作线程来执行任务,保证所有任务按照指定顺序执行。
2.newSingleThreadExecutors将corePoolSize和maximumPoolSize都设置成了为1,其使用的LinkedBlockingQueue堵塞队列;
适用于一个任务一个任务执行的场景;
3.newCachedThreadPool:创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程,若无可回收,则新建线程
//一池N个线程
ExecutorService threadPool = Executors.newCachedThreadPool();
//底层实现:
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
主要特点如下:
1.创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程,若无可回收,则新建线程。
2.newCachedThreadPool将corePoolSize设置为0,将maximumPoolSize设置为Integer.MAX_VALUE,使用的SynchronousQueue队列,也就是说来了任务就创建线程运行,当线程空闲超过60秒,就销毁线程。
适用于:执行很多短期异步的小程序或者负载较轻的服务器
3.禁止使用Executors创建线程池
阿里巴巴Java开发手册说明禁止使用 Executors 创建线程池:
线程池不允许使用Executors去创建,而是通过ThreadPoolExecutor的方式,这样的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险。 说明:Executors返回的线程池对象的弊端如下:
1)FixedThreadPool和SingleThreadPool:
允许的请求队列长度为Integer.MAX_VALUE,可能会堆积大量的请求,从而导致OOM。
2)CachedThreadPool:
允许的创建线程数量为Integer.MAX_VALUE,可能会创建大量的线程,从而导致OOM。
为什么阿里巴巴开发手册中建议我们不要使用Executors创建线程池,Executors 不是简化了我们创建各种类型线程池的方式吗?其实,我们可以在上面使用Executors创建线程池的例子中看其对应的底层实现就明白了;
其传入的workQueue( new LinkedBlockingQueue() )是一个边界为 Integer.MAX_VALUE 队列,我们可以称之为无界队列了,因为边界太大了,这么大的等待队列也是非常消耗内存的
除此之外,该 ThreadPoolExecutor方法使用的是默认拒绝策略(直接拒绝),但并不是所有业务场景都适合使用这个拒绝策略,有时候很重要的请求过来直接选择拒绝显然是不合适的
我们也可以看到使用 Executors 创建的线程池太过于理想化,并不能满足很多现实中的业务场景,所以建议我们通过 ThreadPoolExecutor来创建,并传入合适的参数。
4.ThreadPoolExecutor简介
我们可以看到这三个常用的线程池底层实现都使用了ThreadPoolExecutor去创建线程池。现在我们看下底层中关于ThreadPoolExecutor的七个关键参数;
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {
if (corePoolSize < 0 ||
maximumPoolSize <= 0 ||
maximumPoolSize < corePoolSize ||
keepAliveTime < 0)
throw new IllegalArgumentException();
if (workQueue == null || threadFactory == null || handler == null)
throw new NullPointerException();
this.acc = System.getSecurityManager() == null ?
null :
AccessController.getContext();
this.corePoolSize = corePoolSize;
this.maximumPoolSize = maximumPoolSize;
this.workQueue = workQueue;
this.keepAliveTime = unit.toNanos(keepAliveTime);
this.threadFactory = threadFactory;
this.handler = handler;
}
1.corePoolSize:线程池中的常驻核心线程数;
2.maximumPoolSize:线程池中能够容纳同时执行的最大线程数,此值必须大于等于1;
3.keepAliveTime:多余的空闲线程的存活时间;
4.当前线程池数量超过corePoolSize时,当空闲时间达到keepAliveTime值时,多余空闲线程会被销毁直到只剩下corePoolSize个线程为止;
5.unit:keepAlivetime的单位
6.workQueue:任务队列,被提交但尚未被执行的任务。
7.threadFactory:表示生成线程池中工作线程的线程工厂,用于创建线程一般用默认的即可
8.handler:拒绝策略,当提交的任务过多而不能及时处理时,我们可以定制策略来处理任务;
四种拒绝策略
- AbortPolicy(抛出一个异常,默认的);直接抛出RejectExecutionException异常阻止系统正常运行。
- DiscardPolicy(直接丢弃任务);
- DiscardOldestPolicy(丢弃队列里最老的任务,将当前这个任务继续提交给线程池);
- CallerRunsPolicy(交给线程池调用所在的线程进行处理);
以上内置拒绝策略均实现了RejectExecutionHandler接口
线程池创建线程的流程图:
在创建了线程池后,当有请求任务来之后,将会安排池中的线程去执行请求任务,当线程池中的线程数目达到了核心线程数corePoolSize后,就会把任务放到堵塞队列中,直到堵塞队列满后,就会判断线程数是否达到设置的最大线程数,没有则创建线程去执行任务,如果线程数达到设置最大线程数,则会根据对应拒绝策略去处理任务。
ThreadPoolExecutor的demo示例:
import java.util.concurrent.*;
public class ThreadPoolExecutorDemo {
public static void main(String[] args) throws InterruptedException {
ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(
1, 5, 1L, TimeUnit.SECONDS,
new LinkedBlockingQueue<>(5),
Executors.defaultThreadFactory(),
new ThreadPoolExecutor.AbortPolicy());
/**
*allowCoreThreadTimeOut为true,则线程池数量最后销毁到0个。
*allowCoreThreadTimeOut为false销毁机制:超过核心线程数时,而且(超过最大值或者timeout过),就会销毁。
*/
threadPoolExecutor.allowCoreThreadTimeOut(true);
printThreadPoolStatus(threadPoolExecutor);
for (int i = 1; i <= 10; i++) {
threadPoolExecutor.execute(new TaskDemo());
}
}
/**
* 监控当前线程池
* @param threadPool
*/
public static void printThreadPoolStatus(ThreadPoolExecutor threadPool) {
ScheduledExecutorService scheduledExecutorService = new ScheduledThreadPoolExecutor(1);
scheduledExecutorService.scheduleAtFixedRate(() -> {
System.out.println("=========================");
System.out.println("ThreadPool Size: "+ threadPool.getPoolSize());
System.out.println("Active Threads: "+ threadPool.getActiveCount());
System.out.println("Number of Tasks "+ threadPool.getCompletedTaskCount());
System.out.println("Number of Tasks in Queue:"+ threadPool.getQueue().size());
System.out.println("=========================");
}, 0, 1, TimeUnit.SECONDS);
}
}
class TaskDemo implements Runnable{
@Override
public void run() {
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(Thread.currentThread().getName()+"\t =====执行任务");
}
}
5.如何设置线程数量
我们可以根据不同的业务设置不同的参数,常见的两种线程池设置参数的公式:
1.CPU密集的意思该任务需要大量的运算,而没有堵塞,CPU一直全速运行。
CPU密集任务只有在真正的多核cpu上才可能得到加速(通过多线程)
CPU密集型任务配置尽可能少的线程数量;
一般公式:CPU核实+1个线程的线程池;
2.IO密集型即该任务需要大量的IO,即大量的堵塞。在单线程上运行IO密集型的任务会导致浪费大量的CPU运算能力浪费在等待。所以在IO密集型任务中使用多线程可以大大的加速程序运行,即使在单核CPU上,这种加速主要就是利用了被浪费掉的堵塞时间。
方式1:由于IO密集型任务线程并不是一直在执行任务,则应配置尽可能多的线程,如:CPU核数*2
方式2:IO密集型时,大部分线程都堵塞,故需要多配置线程数;
参考公式:
CPU核数/1-堵塞系数,堵塞系数在0.8-0.9之间;
比如8核cpu 8/1-0.9 = 80个线程 建议堵塞系数取0.9;
当然最好的参数需要适用自己的业务场景,不断的实践应用,不断的调整,让设置参数最优化。