四张图看懂线程池

最新推荐文章于 2024-08-24 17:39:43 发布

技术不值钱

最新推荐文章于 2024-08-24 17:39:43 发布

阅读量509

点赞数

分类专栏： java

本BLOG上原创文章未经本人许可，不得用于商业用途。转载请注明出处，否则保留追究法律责任的权利。

本文链接：https://blog.csdn.net/cow4j/article/details/119426823

版权

java 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

线程池

程序的运行，本质上是对系统资源(CPU、内存、磁盘、网络等)的使用。如何高效的使用这些资源，是编程优化演进的一个方向。线程池就是一种对CPU利用的优化手段。

池化技术

池化技术就是提前保存大量的资源，以备不时之需。在机器资源有限的情况下，使用池化技术可以大大的提高资源的利用率，以此来提升性能。

在编程领域，一些常用的池化技术有(线程池、连接池、内存池、对象池等)。

带着问题看线程池

线程池的线程是如何做到复用的？

当线程小于核心线程数时，队列中的取数据使用take方法，该方法中使用了线程的await，这样一来，线程就不会被回收，而大于核心线程数以外的线程使用poll获取任务，当没有任务时poll超时会返回null，这时候该线程就会被退出。

我不太擅长文字描述，大家直接看下面的四张图，然后对照源码，我相信很容易就能看懂了。

线程池是如何做到高效并发的？

其实就是使用了Java的并发包中的AtomicInteger来记录状态以及线程数量，使用了ReentantLock，都是使用的CAS来进行处理，任何东西都不是绝对的，只有最适合，大家慢慢体会。

线程数量

CPU密集型

CPU使用率较高，也就是经常计算一些复杂的运算，逻辑处理等情况非常多的时候，线程数一般只需要设置为CPU核心数的线程个数就可以了。这一类型多出现在开发中的一些业务复杂计算和逻辑处理过程中。
I/O密集型

CPU使用率较低，程序中会存在大量的I/O操作占用时间，导致线程空余时间很多，所以通常就需要开CPU核心数两倍的线程。当线程进行I/O操作CPU空闲时，启用其他线程继续使用CPU，以提高CPU的使用率。线程等待时间所占比例越高，需要越多线程来继续使用CPU。这一类型在开发中主要出现在一些计算业务频繁的逻辑中。

一个计算为主的程序，多线程跑的时候，可以充分利用起所有的CPU核心数，但是如果线程数远超出CPU核心数量，反而会使得任务效率下降，因为频繁的切换线程也是要消耗时间的。因此对于CPU密集型的任务来说，线程数等于CPU数是最好的。

如果是一个磁盘或网络为主的程序，一个线程处于IO等待的时候，另一个线程还可以在CPU里面运行，有时候CPU闲着没事干，所有的线程都在等着IO，此时可以增加线程数，让CPU可以继续工作，但并不是线程越多越好，一般是CPU核心数的两倍是最佳的。

创建线程池

package com.doaredo.test;

import org.junit.Test;
import java.util.concurrent.*;

public class ThreadPoolDemo {

    @Test
    public void threadPoolTest() {
        // 创建一个线程池
        ExecutorService executorService =
                new ThreadPoolExecutor(1, 1, 60L,
                        TimeUnit.SECONDS, new ArrayBlockingQueue<>(10));
        // 添加任务
        executorService.execute(new Runnable() {
            @Override
            public void run() {
                System.out.println("threadPool");
            }
        });
        // 关闭线程池
        executorService.shutdown();
    }
}

在了解线程池之前，我们需要先了解ThreadPoolExecutor构造函数中参数的意思。

corePoolSize

线程池的核心线程数，线程池没有任何任务的情况下，也会有核心线程池在等待任务的到来。
maximumPoolSize

最大线程数，不管提交了多少任务，线程池里最多工作线程数不会超过这个值。
keepAliveTime

线程的存活时间，当线程池里的线程数大于corePoolSize时，如果等待keepAliveTime时长还没有任务，则该线程退出。
unit

用来指定keepAliveTime的单位，比如秒：TimeUnit.SECONDS。
workQueue

阻塞队列，提交的任务将会被放到这个队列里
threadFactory

线程工厂，用来创建线程，主要是为了给线程起名字，默认工厂的线程名字：pool-1-thread-3。
handler

拒绝策略，当线程池里线程被使用完，并且队列也满了的时候会使用拒绝策略。

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler) {
    if (corePoolSize < 0 ||
        maximumPoolSize <= 0 ||
        maximumPoolSize < corePoolSize ||
        keepAliveTime < 0)
        throw new IllegalArgumentException();
    if (workQueue == null || threadFactory == null || handler == null)
        throw new NullPointerException();
    this.acc = System.getSecurityManager() == null ?
        null :
    AccessController.getContext();
    this.corePoolSize = corePoolSize;
    this.maximumPoolSize = maximumPoolSize;
    this.workQueue = workQueue;
    this.keepAliveTime = unit.toNanos(keepAliveTime);
    this.threadFactory = threadFactory;
    this.handler = handler;
}

线程状态和数量计算

在读ThreadPoolExecutor源码之前，我们需要先了解以下知识点：

"|"或运算【二进制对应的位中，有一个为1则为1，否则为0】

"~"取反运算【二进制对应的位中，1变成0，0变成1】

"&"与运算(从高位开始比较，同为1则取1，否则取0)

ThreadPoolExecutor源码中定义了线程的五种状态：

RUNNING，运行状态，值是最小的，刚创建的线程池就是此状态。
SHUTDOWN，停工状态，不再接收新任务，已经接收的会继续执行。
STOP，停止状态，不再接收新任务，已经接收的正在执行的任务也会中断。
TIDYING，清空状态，所有任务都停止了，工作的线程也全部结束了。
TERMINATED，终止状态，线程池已销毁。

11111 (5)

//CAS
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
//线程池线程数的bit数(Integer.SIZE为32，这里就是29)
private static final int COUNT_BITS = Integer.SIZE - 3;
//低29位表示最大线程数量(表达式结果为：536870911)
//0001 1111 1111 1111 1111 1111 1111 1111(29位1)
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;

// 高三位来表示线程的状态，分别为111、000、001、010、011五种状态
//1110 0000 0000 0000 0000 0000 0000 0000
private static final int RUNNING    = -1 << COUNT_BITS;
//0000 0000 0000 0000 0000 0000 0000 0000
private static final int SHUTDOWN   =  0 << COUNT_BITS;
//0010 0000 0000 0000 0000 0000 0000 0000
private static final int STOP       =  1 << COUNT_BITS;
//0100 0000 0000 0000 0000 0000 0000 0000
private static final int TIDYING    =  2 << COUNT_BITS;
//0110 0000 0000 0000 0000 0000 0000 0000
private static final int TERMINATED =  3 << COUNT_BITS;

// Packing and unpacking ctl
private static int runStateOf(int c)     { return c & ~CAPACITY; }
private static int workerCountOf(int c)  { return c & CAPACITY; }
private static int ctlOf(int rs, int wc) { return rs | wc; }

/*
     * Bit field accessors that don't require unpacking ctl.
     * These depend on the bit layout and on workerCount being never negative.
     */

private static boolean runStateLessThan(int c, int s) {
    return c < s;
}

private static boolean runStateAtLeast(int c, int s) {
    return c >= s;
}

private static boolean isRunning(int c) {
    return c < SHUTDOWN;
}

线程状态和数量计算

在ThreadPoolExecutor中使用AtomicInteger来记录线程的数量，但是只使用了AtomicInteger中value的低29位，高3位用来记录线程的状态，也就是上面的五种状态，分别由int类型的高3位来表示。

在java中一个int类型占4个字节，1个字节=8bit，也就是一个int类型有32bit。AtomicInteger中的value就是使用的int类型。

//低29位表示最大线程数量(表达式结果为：536870911)
//0001 1111 1111 1111 1111 1111 1111 1111(29位1)
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;
private static int runStateOf(int c)     { return c & ~CAPACITY; }
private static int workerCountOf(int c)  { return c & CAPACITY; }

我们看上面两个方法，CAPACITY初始值为(1 << COUNT_BITS) - 1，也就是0001 1111 1111 1111 1111 1111 1111 1111，高3位全为0，低29位全为1。

runStateOf(int c)、workerCountOf(int c)两个方法中的参数，在调用的时候传递的就是AtomicInteger的value值。这样在runStateOf方法中，通过value & _{CAPACITY(value与上CAPACITY的按位取反)，}CAPACITY得到的低29位全是0，然后跟value做与运算【同为1则取1，否则取0】，所以后29位都是0，最终得到的结果就是value的高3位结果，而这3位就表示的线程的状态。

同理，在workerCountOf方法，通过value & CAPACITY，最终得到的就是value的低29位，而这低29位就是表示的线程的数量。

照图看源码

对线程池的一些概念和计算有了一定了解后。其实，线程池就是添加任务，然后处理任务，关键在于对这个“池”的维护，而这个“池”中就是存放的线程。但是“池”中的线程数量是非常有限的，所以还需要一个队列来存放没有被线程处理的任务。

一个线程要处理任务，就需要从队列中去获取任务，当队列装满了后，新来的任务就会直接创建非核心线程来直接处理。这里的核心线程与非核心线程，其实只是逻辑概念，最大的区别就是，核心线程需要一直在“池”中处理任务，也就是线程的复用；而非核心线程在处理完任务后，就会退出，这里不是处理完一个任务就退出，而是要根据队列中存放任务的情况来决定。

根据线程池不同的情况整理出四张图，这四张图可以帮助我们更好的理解线程池，从而更容易看懂其源码：

11111 (1)

11111 (2)

11111 (3)

11111 (6)

execute/submit

线程池的工作就是以添加任务为驱动进行工作的。

线程池就是保存一系列线程的容器，在ThreadPoolExecutor中，将线程保存在一个HashSet中，为了防止线程处理不过来，还有一个用来保存任务的队列workQueue：

private final HashSet<Worker> workers = new HashSet<Worker>();
private final BlockingQueue<Runnable> workQueue;

往线程池提交任务有两种方式，execute是ExecutorService接口定义的，submit有三种方法重载都在AbstractExecutorService(ExecutorService的实现)中定义，都是将要执行的任务包装为FutureTask来提交，使用者可以通过FutureTask来拿到任务的执行状态和执行最终结果，最终调用的都是execute方法。对于线程池来说，任务的状态是由FutureTask自己维护的，对线程池透明。

public Future<?> submit(Runnable task) {
  if (task == null) throw new NullPointerException();
  RunnableFuture<Void> ftask = newTaskFor(task, null);
  execute(ftask);
  return ftask;
}

/**
     * @throws RejectedExecutionException {@inheritDoc}
     * @throws NullPointerException       {@inheritDoc}
     */
public <T> Future<T> submit(Runnable task, T result) {
  if (task == null) throw new NullPointerException();
  RunnableFuture<T> ftask = newTaskFor(task, result);
  execute(ftask);
  return ftask;
}

/**
     * @throws RejectedExecutionException {@inheritDoc}
     * @throws NullPointerException       {@inheritDoc}
     */
public <T> Future<T> submit(Callable<T> task) {
  if (task == null) throw new NullPointerException();
  RunnableFuture<T> ftask = newTaskFor(task);
  execute(ftask);
  return ftask;
}

submit中都是调用的ThreadPoolExecutor中的execute方法：

public void execute(Runnable command) {
  if (command == null)
    throw new NullPointerException();
  //获取AtomicInteger中的value值
  int c = ctl.get();
  //判断当前线程数是否小于设置的核心线程数
  if (workerCountOf(c) < corePoolSize) {
    //如果线程数没有达到设置的核心线程数，则直接添加一个核心线程
    //提交任务后，会优先启动核心线程处理
    if (addWorker(command, true))
      return;
    //任务添加失败则重新获取value值
    c = ctl.get();
  }
  //如果线程池在运行状态，将任务添加到等待队列(如果队列已经满了就会返回false)
  if (isRunning(c) && workQueue.offer(command)) {
    int recheck = ctl.get();
    //如果线程池不是运行状态，将刚添加的任务从队列移除并且执行拒绝策略
    if (! isRunning(recheck) && remove(command))
      reject(command);
    //如果线程数为0，则添加一个非核心线程，并且不指定首次执行任务
    else if (workerCountOf(recheck) == 0)
      addWorker(null, false);
  }
  //添加非核心线程，指定首次执行任务，如果添加失败，执行异常策略
  else if (!addWorker(command, false))
    reject(command);
}

addWorker

在分析addWorker方法前，先了解retry这个标记，retry不是关键字，它是一个标记，标记后面一般跟循环，功能类似于goto，直接上案例：

package com.doaredo.test;

import org.junit.Test;

public class RetryDemo {

    @Test
    public void retryContinue(){
        retry:
        for (int i = 0; i < 2; i++){
            for (int j =0; j < 5; j++){
                System.out.print(j);
                if(j == 3){
                    continue retry;
                }
            }
        }
        System.out.println("=====================");
    }

    @Test
    public void retryBreak(){
        retry:
        for (int i = 0; i < 2; i++){
            for (int j =0; j < 5; j++){
                System.out.print(j);
                if(j == 3){
                    break retry;
                }
            }
        }
        System.out.println("=====================");
    }
}

retryContinue()输出结果：01230123=====================

retryBreak()输出结果：0123=====================

我相信看了案例，大家应该就明白了，continue retry;就是跳转到外层循环继续执行，而break retry;则是直接跳出整个循环。

addWorker方法分析

先看retry后面的双重for循环，第9-13行代码应该是这里比较难理解的，我们后面再来分析，这里我们直接无视这部分代码。2-29行代码，主要做的功能就是22行代码中将线程数+1。

private boolean addWorker(Runnable firstTask, boolean core) {
  retry:
  for (;;) {
    int c = ctl.get();
    int rs = runStateOf(c);
    //如果线程池的状态在SHUTDOWN或之上的状态，只有一种情况还需要继续添加线程
    //这种情况就是：线程池已经SHUTDOWN，但是队列中还有任务在排队，而且不接受新任务
    //这里还继续添加线程是为了加快执行等待队列中的任务，尽快让线程池关闭
    if (rs >= SHUTDOWN &&
        ! (rs == SHUTDOWN &&
           firstTask == null &&
           ! workQueue.isEmpty()))
      return false;

    for (;;) {
      int wc = workerCountOf(c);
      //如果线程数超过理论最大容量，如果core是true跟最大核心线程数比较，否则跟最大线程数比较
      if (wc >= CAPACITY ||
          wc >= (core ? corePoolSize : maximumPoolSize))
        return false;
      //CAS操作，增加线程数+1，成功则跳出双层循环
      if (compareAndIncrementWorkerCount(c))
        break retry;
      c = ctl.get();  // Re-read ctl
      if (runStateOf(c) != rs)
        continue retry;
      // else CAS failed due to workerCount change; retry inner loop
    }
  }
  //到这里说明已经成功的将线程数+1，但是真正的线程还没有被添加
  boolean workerStarted = false;
  boolean workerAdded = false;
  Worker w = null;
  try {
    //Worker继承了AQS，实现了Runnable接口的包装类  
    w = new Worker(firstTask);
    final Thread t = w.thread;
    if (t != null) {
      //加锁
      final ReentrantLock mainLock = this.mainLock;
      mainLock.lock();
      try {
        // Recheck while holding lock.
        // Back out on ThreadFactory failure or if
        // shut down before lock acquired.
        int rs = runStateOf(ctl.get());
        //检查线程状态，跟前面一样，只有当线程池处于RUNNING或者处于SHUTDOWN并且firstTask==null的时候，这时候创建Worker来加速处理队列中的任务
        if (rs < SHUTDOWN ||
            (rs == SHUTDOWN && firstTask == null)) {
          //线程只能被start一次
          if (t.isAlive()) // precheck that t is startable
            throw new IllegalThreadStateException();
          workers.add(w);
          int s = workers.size();
          if (s > largestPoolSize)
            largestPoolSize = s;
          workerAdded = true;
        }
      } finally {
        mainLock.unlock();
      }
      if (workerAdded) {
        t.start();
        workerStarted = true;
      }
    }
  } finally {
    if (! workerStarted)
      addWorkerFailed(w);
  }
  return workerStarted;
}

execute方法没有加锁，但是在addWorker方法内部加锁了，可以保证不会创建超过预期的线程数。

worker是怎么工作的

worker的run方法调用的是ThreadPoolExecutor的runWorker方法。

final void runWorker(Worker w) {
    Thread wt = Thread.currentThread();
    //取出需要执行的任务
    Runnable task = w.firstTask;
    w.firstTask = null;
    w.unlock(); // allow interrupts
    boolean completedAbruptly = true;
    try {
        //task不为null，或者队列中能取到任务(这里getTask()会阻塞)
        while (task != null || (task = getTask()) != null) {
            //这个lock在这里是为了如果线程被中断，那么会抛出InterruptedException，而退出循环，结束线程
            w.lock();
            // If pool is stopping, ensure thread is interrupted;
            // if not, ensure thread is not interrupted.  This
            // requires a recheck in second case to deal with
            // shutdownNow race while clearing interrupt
            //判断线程是否需要中断
            if ((runStateAtLeast(ctl.get(), STOP) ||
                 (Thread.interrupted() &&
                  runStateAtLeast(ctl.get(), STOP))) &&
                !wt.isInterrupted())
                wt.interrupt();
            try {
                //任务开始执行前的钩子方法
                beforeExecute(wt, task);
                Throwable thrown = null;
                try {
                    task.run();
                } catch (RuntimeException x) {
                    thrown = x; throw x;
                } catch (Error x) {
                    thrown = x; throw x;
                } catch (Throwable x) {
                    thrown = x; throw new Error(x);
                } finally {
                    //任务执行后的钩子方法
                    afterExecute(task, thrown);
                }
            } finally {
                task = null;
                w.completedTasks++;
                w.unlock();
            }
        }
        completedAbruptly = false;
    } finally {
        //退出worker
        processWorkerExit(w, completedAbruptly);
    }
}

private Runnable getTask() {
    boolean timedOut = false; // Did the last poll() time out?

    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);

        // Check if queue empty only if necessary.
        //检查线程池的状态，如果已经是STOP及以上的状态，或者已经SHUTDOWN，队列也是空的时候，直接return null，并将Worker数量-1
        if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
            decrementWorkerCount();
            return null;
        }

        int wc = workerCountOf(c);

        // Are workers subject to culling?
        // 注意这里的allowCoreThreadTimeOut参数，字面意思是否允许核心线程超时，即如果我们设置为false，那么只有当线程数wc大于corePoolSize的时候才会超时
        //更直接的意思就是，如果设置allowCoreThreadTimeOut为false，那么线程池在达到corePoolSize个工作线程之前，不会让闲置的工作线程退出
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
	    //确认超时，将Worker数-1，然后返回
        if ((wc > maximumPoolSize || (timed && timedOut))
            && (wc > 1 || workQueue.isEmpty())) {
            if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }

        try {
            //从队列中取任务，根据timed选择是有时间期限的等待还是无时间期限的等待
            Runnable r = timed ?
                workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
            workQueue.take();
            if (r != null)
                return r;
            timedOut = true;
        } catch (InterruptedException retry) {
            timedOut = false;
        }
    }
}

解答前面提出的三个问题：

线程池如何复用？

在getTask()方法中，从队列中取任务这一步来决定线程是否可以被复用。

当线程池未满时，从队列中获取任务，使用的是take()方法，如果没有获取到任务，直接调用线程的await()方法等待队列中的新任务。
当线程池已满时，从队列中获取任务，使用的是poll()方法，该方法如果没有获取到任务，线程就会退出。

如何高效并发？

线程池状态和工作线程数量记录由AtomicInteger的value来记录，保证了原子性
Worker中添加新Worker的时候，使用了ReentrantLock
工作线程Worker从等待队列中取任务的时候，这个由工作队列本身来保证线程安全，比如LinkedBlockingQueue等。

线程池优点

线程池复用线程有以下优点：

减少资源创建：减少内存开销，创建线程占用内存
降低系统开销：创建线程需要时间，会延迟处理的请求
提高稳定性：避免无限创建线程引起内存溢出

Executors之无阶队列

在阿里开发手册上有一条：线程池不允许使用Executors去创建，而是通过ThreadPoolExecutor的方式来创建，具体是什么原因往后看。

Executors创建线程池的方式

创建返回ThreadPoolExecutor对象
创建返回ScheduleThreadPoolExecutor对象
创建返回ForkJoinPool对象

前面我们讲了ThreadPoolExecutor的源码，我们以创建返回ThreadPoolExecutor对象的方式为例，返回ThreadPoolExecutor对象共有三种方法：

newCachedThreadPool(创建可缓存的线程池)
newSingleThreadExecutor(创建单线程的线程池)
newFixedThreadPool(创建固定长度的线程池)

Executors源码如下：

/*
和newSingleThreadExecutor类似
*/
public static ExecutorService newFixedThreadPool(int nThreads) {
    return new ThreadPoolExecutor(nThreads, nThreads,
                                  0L, TimeUnit.MILLISECONDS,
                                  new LinkedBlockingQueue<Runnable>());
}
/*
当一个任务提交时，首先会创建一个核心线程来执行任务，如果超过核心线程的数量，将会放入队列中
因为LinkedBlockingQueue的长度为Integer.MAX_VALUE，因此队列中中以插入非常多的任务，从而引起OOM
因为队列是无界队列，maximumPoolSize和keepAliveTime参数将无效，这样就不会创建非核心线程
*/
public static ExecutorService newSingleThreadExecutor() {
    return new FinalizableDelegatedExecutorService
        (new ThreadPoolExecutor(1, 1,
                                0L, TimeUnit.MILLISECONDS,
                                new LinkedBlockingQueue<Runnable>()));
}
/*
当一个任务提交时，corePoolSize为0不创建核心线程
SynchronousQueue是一个不存储元素的队列，因此最终会创建非核心线程来执行任务
非核心线程空闲60s将被回收，而Integer.MAX_VALUE最大线程数非常大，这样基本可以无限创建线程
在资源有限的情况下容易引起OOM异常
*/
public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                  60L, TimeUnit.SECONDS,
                                  new SynchronousQueue<Runnable>());
}

OOM异常测试

@Test
public void oomTest(){
    ExecutorService executorService = Executors.newCachedThreadPool();
    AtomicInteger i = new AtomicInteger(0);
    for(;;){
        executorService.submit(()->{
            System.out.println(i.getAndIncrement());
        });
    }
}

设置VM options：-Xms5M -Xmx5M

运行结果会抛出异常：

Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "pool-1-thread-5154"

技术不值钱

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录