Executor线程池原理与源码简析

最新推荐文章于 2024-07-22 14:15:06 发布

小乐乐的天台

最新推荐文章于 2024-07-22 14:15:06 发布

阅读量120

点赞数

分类专栏： Java并发文章标签： java

本文链接：https://blog.csdn.net/qq_41931364/article/details/120713098

版权

Java并发专栏收录该内容

15 篇文章 0 订阅

订阅专栏

Executor线程池原理与源码简析

1、线程、协程与线程池
2、线程池重点方法详解

1、线程、协程与线程池

1.1、什么是线程？

线程是CPU调度资源的最小单位，线程模型分为KLT模型与ULT模型，JVM使用的KLT模型，Java线程与OS线程保持1:1的映射关系，也就是说有一个java线程也会在操作系统里有一个对应的线程。
Java线程有以下几种形态：
1、NEW,新建。
2、RUNNABLE,运行。
3、BLOCKED,阻塞。
4、WAITING,等待。
5、TIMED_WAITING,超时等待。
6、TERMINATED，终结。
在Thread类中有一个静态类就封装着状态的枚举，代码如下所示：
看源码的话会有很多注释，这里我删掉了注释

public enum State {
	// 新建
    NEW,
    // 运行中
    RUNNABLE,
    // 阻塞
    BLOCKED,
    // 等待
    WAITING,
    // 超时等待
    TIMED_WAITING,
    // 终止
    TERMINATED;
}

Java线程状态切换如下图所示：

在这里插入图片描述

1.2、什么是协程

协程 (纤程，用户级线程)，目的是为了追求最大力度的发挥硬件性能和提升软件的速度，协程基本原理是:在某个点挂起当前的任务，并且保存栈信息，去执行另一个任务；等完成或达到某个条件时，再还原原来的栈信息并继续执行(整个过程线程不需要上下文切换)。
Java原生不支持协程，在纯java代码里需要使用协程的话需要引入第三方包,如：quasar。
自己理解：其实就相当于ULT模型，不用OS去管理线程，所以线程的操作就不需要切换到内核，也就是不用上下文切换。但是会有一个问题就是，不能发挥cpu的多核性能。
下面给一张KLT和ULT模型的对比图。

在这里插入图片描述

1.3、线程池

1.3.1、什么是线程池？

“线程池”，顾名思义就是一个线程缓存，线程是稀缺资源，如果被无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，因此Java中提供线程池对线程进行统一分配、调优和监控。
自己理解：因为线程的创建以及状态的切换是一个非常重的操作（涉及到用户态到内核态的切换），有的时候创建一个线程的时间可能需要10ms，但是这个线程执行任务的时间却只有0.1ms，如果不去重用这个线程，将会是一个极大的浪费。

1.3.2、什么时候使用线程池？

1、单个任务处理时间比较短。
2、需要处理的任务数量很大。

1.3.3、线程池优势

1、重用存在的线程，减少线程创建，消亡的开销，提高性能。
2、提高响应速度。当任务到达时，任务可以不需要的等到线程创建就能立即执行。
3、提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。

1.3.4、线程池的参数

corePoolSize：线程池中的核心线程数，当提交一个任务时，线程池创建一个新线程执行任务，直到当前线程数等于corePoolSize；如果当前线程数为corePoolSize，继续提交的任务被保存到阻塞队列中，等待被执行；如果执行了线程池的prestartAllCoreThreads()方法，线程池会提前创建并启动所有核心线程。
maximumPoolSize：就是核心线程加上非核心线程的数量。
keepAliveTime：当没有任务可做的时候，线程会阻塞，直至超过了这个时间，就会被销毁掉。
unit：keepAliveTime的单位。
workQueue：用来保存等待被执行的任务的阻塞队列，且任务必须实现Runable接口，详情请看1.3.6。
threadFactory：它是ThreadFactory类型的变量，用来创建新线程。默认使用 Executors.defaultThreadFactory() 来创建线程。使用默认的ThreadFactory来创建线程时，会使新创建的线程具有相同的NORM_PRIORITY优先级并且是非守护线程，同时也设置了线程的名称。
handler：当线程都有任务且阻塞队列也满了的时候就会执行拒绝策略，详情请看1.3.7。

1.3.5、线程池的大致运行过程

1、线程池刚创建的时候里面是没有线程的，当这时候进来一个任务时，Jvm会先创建一个线程去执行这个任务，如果再进来一个任务，这个任务不会直接抛给刚才那个线程去执行，而是会再创建一个线程，将任务交给那个线程去执行。
2、当核心线程数创建满之后，再进来任务时，任务会先放到阻塞队列，核心线程会自己去拿，直到阻塞队列放满。
3、当阻塞队列也放满的时候，Jvm会再次创建线程去执行任务，这次创建的线程称之为非核心线程，再进来第二个任务也是一样的，创建非核心线程执行任务，直至非核心线程数也创建满。
4、当阻塞队列满，核心线程与非核心线程都满时，再进来任务的话，就会执行拒绝策略。
总结：核心线程= =>阻塞队列= =>非核心线程= =>拒绝策略。
下面是ThreadPoolExecutor类的源码：

public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException();
    int c = ctl.get();
    // 如果核心线程未创建满，则创建核心线程执行任务
    // 这个参数true代表非核心线程
    if (workerCountOf(c) < corePoolSize) {
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
    // 核心线程创建满之后，将给队列里面放
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        if (! isRunning(recheck) && remove(command))
            reject(command);
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    // 上面if条件的队列也满了，将会创建非核心线程
    // 这个参数false代表非核心线程
    else if (!addWorker(command, false))
    	// 如果都满了，执行拒绝策略
        reject(command);
}

1.3.6、线程池的阻塞队列

1、ArrayBlockingQueue：基于数组结构的有界阻塞队列，按FIFO排序任务。
2、LinkedBlockingQuene：基于链表结构的阻塞队列，按FIFO排序任务，吞吐量通常要高于ArrayBlockingQuene。
3、SynchronousQuene：一个不存储元素的阻塞队列，每个插入操作必须等到另一个线程调用移除操作，否则插入操作一直处于阻塞状态，吞吐量通常要高于 LinkedBlockingQuene。
4、priorityBlockingQuene：具有优先级的无界阻塞队列。

1.3.7、线程池的拒绝策略

jdk自带了四种拒绝策略，如下：
1、AbortPolicy
直接抛出异常，继承RuntimeException，一般不建议使用。

2、CallerRunsPolicy
如果当前线程池未关闭，将直接将此任务交给提交该任务的线程去处理。

public static class CallerRunsPolicy implements RejectedExecutionHandler {
    public CallerRunsPolicy() { }

    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        if (!e.isShutdown()) {
            r.run();
        }
    }
}

3、DiscardOledestPolicy
丢弃队列中最老的任务，再次尝试添加新任务。

4、DiscardPolicy
什么都不干，意思就是默默的丢弃掉该任务。

1.3.8、线程池父类Executor以及线程池状态切换方法

Executor接口是线程池框架中最基础的部分，定义了一个用于执行Runnable的execute方法。
下面是它的继承与实现，如下图所示：

在这里插入图片描述

从图中可以看出Executor下有一个重要子接口ExecutorService，其中定义了线程池的具体行为：
1、execute：履行Ruannable类型的任务。
2、submit：可用来提交Callable或Runnable任务，并返回代表此任务的 Future 对象。
3、shutdown：在完成已提交的任务后封闭办事，不再接管新任务。
4、shutdownNow：停止所有正在履行的任务并封闭办事。
5、isTerminated：测试是否所有任务都履行完毕了。
6、isShutdown：测试是否该ExecutorService已被关闭。

1.3.9、线程池的状态

1、RUNNING：
状态说明：线程池处在RUNNING状态时，能够接收新任务，以及对已添加的任务进行处理。
状态切换：线程池的初始化状态是RUNNING。换句话说，线程池被一旦被创建，就处于RUNNING状态，并且线程池中的任务数为0！

2、SHUTDOWN：
状态说明：线程池处在SHUTDOWN状态时，不接收新任务，但能处理已添加的任务。
状态切换：调用线程池的shutdown()接口时，线程池由RUNNING -> SHUTDOWN。

3、STOP：
状态说明：线程池处在STOP状态时，不接收新任务，不处理已添加的任务，并且会中断正在处理的任务。
状态切换：调用线程池的shutdownNow()接口时，线程池由(RUNNING or SHUTDOWN ) -> STOP。

4、TIDYING：
状态说明：当所有的任务已终止，ctl记录的”任务数量”为0，线程池会变为TIDYING 状态。当线程池变为TIDYING状态时，会执行钩子函数terminated()。terminated()在 ThreadPoolExecutor类中是空的，若用户想在线程池变为TIDYING时，进行相应的处理；可以通过重载terminated()函数来实现。
状态切换：当线程池在SHUTDOWN状态下，阻塞队列为空并且线程池中执行的任务也为空时，就会由 SHUTDOWN -> TIDYING。当线程池在STOP状态下，线程池中执行的任务为空时，就会由STOP -> TIDYING。

5、TERMINATED：
状态说明：线程池彻底终止，就变成TERMINATED状态。
状态切换：线程池处在TIDYING状态时，执行完terminated()之后，就会由 TIDYING - > TERMINATED。
进入TERMINATED的条件如下：
1、线程池不是RUNNING状态。
2、线程池状态不是TIDYING状态或TERMINATED状态。
3、如果线程池状态是SHUTDOWN并且workerQueue为空。
4、workerCount为0。
5、设置TIDYING状态成功。
如下图所示：

在这里插入图片描述

2、线程池重点方法详解

2.1、addWorker

该方法的主要作用是创建线程并给它一个初始任务，比如在execute()方法里调用。
1、判断线程池的状态，如果不是running状态的话就不允许做后面的操作。
2、创建线程并加锁。
3、放入队列，前面加锁的原因就是能保证一定放到队列。
4、解锁。
5、启动线程。

private boolean addWorker(Runnable firstTask, boolean core) {
    retry:
    // 这里主要是判断线程池的一个状态
    // 就比如说如果不是running状态的话就不允许做下面的操作了
    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);

        // Check if queue empty only if necessary.
        if (rs >= SHUTDOWN &&
            ! (rs == SHUTDOWN &&
               firstTask == null &&
               ! workQueue.isEmpty()))
            return false;

        for (;;) {
            int wc = workerCountOf(c);
            if (wc >= CAPACITY ||
                wc >= (core ? corePoolSize : maximumPoolSize))
                return false;
            if (compareAndIncrementWorkerCount(c))
                break retry;
            c = ctl.get();  // Re-read ctl
            if (runStateOf(c) != rs)
                continue retry;
            // else CAS failed due to workerCount change; retry inner loop
        }
    }

    boolean workerStarted = false;
    boolean workerAdded = false;
    Worker w = null;
    try {
    	// 在这里我们new了一个Worker，由这个Worker去创建线程，并传入了该任务
    	// 在Worker的构造方法中，首先会将这个任务保存，再以自己创建一个线程，如2.2的方法
        w = new Worker(firstTask);
        final Thread t = w.thread;
        if (t != null) {
        	// 这块进行加锁操作，防止高并发
            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                // Recheck while holding lock.
                // Back out on ThreadFactory failure or if
                // shut down before lock acquired.
                int rs = runStateOf(ctl.get());

                if (rs < SHUTDOWN ||
                    (rs == SHUTDOWN && firstTask == null)) {
                    if (t.isAlive()) // precheck that t is startable
                        throw new IllegalThreadStateException();
                    // 这块将刚才的线程放到队列中，以便后续维护引用
                    workers.add(w);
                    int s = workers.size();
                    if (s > largestPoolSize)
                        largestPoolSize = s;
                    workerAdded = true;
                }
            } finally {
            	// 解锁
                mainLock.unlock();
            }
            if (workerAdded) {
            	// 启动，执行Worker的run方法
                t.start();
                workerStarted = true;
            }
        }
    } finally {
        if (! workerStarted)
            addWorkerFailed(w);
    }
    return workerStarted;
}

2.2、Worker构造方法

Worker(Runnable firstTask) {
	// 设置状态为 -1
    setState(-1); // inhibit interrupts until runWorker
    // 将当前任务保存起来
    this.firstTask = firstTask;
    // 这里创建了一个新线程，但是传入的参数是Worker自己
    // 所以当这个线程执行start方法时，调用的是Worker自己的run方法
    this.thread = getThreadFactory().newThread(this);
}

下面这个就是Worker自己的run方法

public void run() {
	// 当点击这个 runWorker 时，传入Worker自己，附带上面的firstTask 参数
	// 这个参数也就是保存的当前任务
	// 调用外部类的方法
    runWorker(this);
}

2.3、runWorker

这个方法主要就是线程执行任务

final void runWorker(Worker w) {
    Thread wt = Thread.currentThread();
    Runnable task = w.firstTask;
    w.firstTask = null;
    w.unlock(); // allow interrupts
    boolean completedAbruptly = true;
    try {
    	// 这里面循环去执行任务，如果自己的任务执行完成就去队列里面取
    	// task 会在最后的finally中将task置为空，因为task已经执行完
    	// getTask()主要就是判断线程是否超时和取出一个队列里面的任务并返回，详情2.4
        while (task != null || (task = getTask()) != null) {
            w.lock();
            if ((runStateAtLeast(ctl.get(), STOP) ||
                 (Thread.interrupted() &&
                  runStateAtLeast(ctl.get(), STOP))) &&
                !wt.isInterrupted())
                wt.interrupt();
            try {
                beforeExecute(wt, task);
                Throwable thrown = null;
                try {
                    task.run();
                // 这里面如果出现了异常，将会抛出到外面去捕捉
                } catch (RuntimeException x) {
                    thrown = x; throw x;
                } catch (Error x) {
                    thrown = x; throw x;
                } catch (Throwable x) {
                    thrown = x; throw new Error(x);
                } finally {
                    afterExecute(task, thrown);
                }
            } finally {
            	// 任务执行完成，将task置为空
                task = null;
                w.completedTasks++;
                w.unlock();
            }
        }
        completedAbruptly = false;
    } finally {
    	// 在这里进行Worker的最后处理，异常呀什么的
    	// 如果是任务抛出的异常，将会重新创建一个线程继续去处理任务，走2.5
        processWorkerExit(w, completedAbruptly);
    }
}

2.4、getTask

这个方法的主要作用是从阻塞队列中拿出一个任务并执行
这块说的剔除线程是指
1、工作的线程大于核心线程数，所以就存在非核心线程，当没有任务的时候，非核心线程是要被剔除掉的。
2、allowCoreThreadTimeOut 是配置的允许核心线程被剔除的时间，当没有任务时，如果核心线程空闲时间超过了它的设置，也将会被剔除。

private Runnable getTask() {
    boolean timedOut = false; // Did the last poll() time out?

    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);

        // Check if queue empty only if necessary.
        if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
            decrementWorkerCount();
            return null;
        }

        int wc = workerCountOf(c);

        // Are workers subject to culling?
        // 1、allowCoreThreadTimeOut 可以配置这个参数使得核心线程过期
        // 2、wc > corePoolSize;当前工作的线程数大于核心线程数的话，就会返回true
        // 当返回true时线程才会被剔除
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

        if ((wc > maximumPoolSize || (timed && timedOut))
            && (wc > 1 || workQueue.isEmpty())) {
            if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }

        try {
            Runnable r = timed ?
            	// 这个poll方法，当队列为空或者条件不满足时，线程没有任务，
            	// 就会阻塞并计时，超时之后就会剔除掉
                workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                workQueue.take();
            if (r != null)
                return r;
            timedOut = true;
        } catch (InterruptedException retry) {
            timedOut = false;
        }
    }
}

2.5、processWorkerExit

主要作用是当线程出现问题之后，将会重新创建一个线程去顶替他，但是任务会丢失，在runWorker中调用。

private void processWorkerExit(Worker w, boolean completedAbruptly) {
    if (completedAbruptly) // If abrupt, then workerCount wasn't adjusted
        decrementWorkerCount();

    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        completedTaskCount += w.completedTasks;
        workers.remove(w);
    } finally {
        mainLock.unlock();
    }

    tryTerminate();

    int c = ctl.get();
    // 当任务小于 Stop 时，需要将已有的任务执行完，所以后面需要将前面抛出异常的线程补上
    if (runStateLessThan(c, STOP)) {
        if (!completedAbruptly) {
            int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
            if (min == 0 && ! workQueue.isEmpty())
                min = 1;
            if (workerCountOf(c) >= min)
                return; // replacement not needed
        }
        // 重新创建线程
        addWorker(null, false);
    }
}

小乐乐的天台

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Executor线程池原理与源码简析

Executor线程池原理与源码简析1、线程、协程与线程池1.1、什么是线程？1.2、什么是协程1.3、线程池1.3.1、什么是线程池？1.3.2、什么时候使用线程池？1.3.3、线程池优势1.3.4、线程池的参数1.3.5、线程池的大致运行过程1、线程、协程与线程池1.1、什么是线程？线程是调度CPU资源的最小单位，线程模型分为KLT模型与ULT模型，JVM使用的KLT模型，Java线程与OS线程保持1:1的映射关系，也就是说有一个java线程也会在操作系统里有一个对应的线程。Java线程有以
复制链接

扫一扫

专栏目录