线程池工作流程及线程复用原理

我还年轻我很平凡

已于 2022-04-18 19:48:07 修改

阅读量2.6k

点赞数 7

分类专栏：理论文章标签：多线程

于 2019-08-28 18:58:39 首次发布

本文链接：https://blog.csdn.net/weixin_43784989/article/details/100094855

版权

理论专栏收录该内容

16 篇文章 0 订阅

订阅专栏

1.Java常用的线程池

1.线程池的作用

线程池的作用就是限制运行线程的数量，降低资源消耗；
创建一个符合需求的线程池，可以有效的提高系统运行的效率；
利用同步队列控制线程的执行与销毁；
提高响应速度：任务来了可以直接执行而不是再去创建线程；
提高线程的可管理性：线程作为执行任务的工具，属于稀缺资源，使用线程池可以统一分配调优监控；

为什么使用线程池会提高效率？
1.重用存在的线程，减少对象创建、销毁的开销，性能佳；
2.根据系统的承载能力，调整线程池中的线程数目，避免开启太多线程；
3.提供定时执行、定期执行、单线程、并发数控制等功能；

为了便于跨大量上下文使用，此类提供了很多可调整的参数和扩展钩子 (hook)。但是，强烈建议程序员使用较为方便的 Executors 工厂方法 Executors.newCachedThreadPool()（无界线程池，可以进行自动线程回收）、Executors.newFixedThreadPool(int)（固定大小线程池）Executors.newSingleThreadExecutor()（单个后台线程），它们均为大多数使用场景预定义了设置
需要注意的是：Java里的线程池的顶级接口是Executor，但是严格讲Executor并不是一个线程池，而是一个工具，其类里面都是静态方法且构造器被private。真正的线程池接口是ExecutorService

2.几个重要的线程类

①ExecutorSerivice：线程池的真正接口
②ThreadPoolExecutor:ExcutorService的实现类
③ScheduledExecutorService：解决需要重复执行的任务
④ScheduledThreadPoolExecutor：继承自ThreadPoolExecutor且实现ScheduledExecutorService接口，周期性任务调度的实现；

3.四种常用线程池

3.1——newCachedThreadPool

创建一个带缓存的无界线程池，但会重用以前构造的线程可用（即可自动进行线程回收）。这些池通常会提高性能，执行许多短期异步任务的程序。

public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>());
    }

ThreadPoolExecutor()方法的底层实现为：

 public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue) {
        this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
             Executors.defaultThreadFactory(), defaultHandler);
    }

根据源码可以得知传入的每个参数的意义：
corePoolSize：核心线程池中保留的线程数(默认为0）
maximumPoolSize：线程池中允许存放的最大线程数(默认最大)

ThreadPoolExecutor可根据传入的corePoolSize和maximumPoolSize自动调整池的大小。当新任务方法execute(Runnable r)中提交，
Ⅰ：如果运行线程小于corePoolSize，则创建新线程来处理请求，即使其他辅助线程也是空闲的。
Ⅱ：如果运行线程多余corePoolSize但小于maximumPoolSize，则仅当队列满时才创建新线程。
Ⅲ：如果设置corePoolSize=maximumPoolSize，则创建了固定容量的线程池。
Ⅳ：如果将maximumPoolSize设置为最基本的无界值(Integer.MAX_VALUE)，则允许线程池适应任意数量的并发数；

keepAliveTime：多余空闲线程的最大存活时间(默认60S)

当线程数有多出corePoolSize的线程，则这些多出来的线程在空闲时间超过keepAliveTime时将会终止。
可以通过setKeepAliveTime来设置空闲时长；

unit：keepAliveTime的时间单位
workQueue：用于在任务之前保存任务的阻塞队列
defaultThreadFactory()：默认的线程工厂，产生的线程都在一个组内且具有相同的优先级；
defaultHandler：任务拒绝策略，有两种情况：①当我们调用shutdown等方法关闭线程池之后，即使线程池内部还有没有执行完的任务，但是由于线程池已经关闭，我们在想继续给线程池提交任务时就会被拒绝。②当达到最大线程数，线程池已经没有能力处理新提交的任务时，也会执行拒绝策略；

3.2——newFixThreadPool

创建一个固定数量线程的线程池，在任何时候最多只有n个线程线程存活在线程池中，如果在所有线程都活动之外再提交了其他任务，新的线程将在队列中等待，直到线程可用；

public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
    }

  public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue) {
        this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
             Executors.defaultThreadFactory(), defaultHandler);
    }

3.3——newSingleThreadPool

创建一个使用单个线程工作的线程池(关闭无限队列)，所有的任务按照指定的顺序(FIFO、LIFO、优先级)执行；

 public static ExecutorService newSingleThreadExecutor() {
        return new FinalizableDelegatedExecutorService
            (new ThreadPoolExecutor(1, 1,
                                    0L, TimeUnit.MILLISECONDS,
                                    new LinkedBlockingQueue<Runnable>()));
    }

public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue) {
        this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
             Executors.defaultThreadFactory(), defaultHandler);
    }

3.4——newScheduledThreadPool

创建一个可以定期执行线程的线程池；

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
        return new ScheduledThreadPoolExecutor(corePoolSize);
    }

 public ScheduledThreadPoolExecutor(int corePoolSize) {
        super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
              new DelayedWorkQueue());
    }

通过上述的介绍之后，除过输入参数中的阻塞队列(后续会介绍)，其他的东西也都很清晰，对于线程池的实现，如下所示：

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class CashPool {
	static volatile int x=0;
	public static void main(String[] args) {
		//可缓存线程池
		ExecutorService es1=Executors.newCachedThreadPool();
		for(int i=0;i<3;i++){
			es1.execute(new Runnable() {
				
				@Override
				public void run() {
					System.out.println("可缓存线程池线程"+Thread.currentThread().getName()+"已运行");
				}
			});
		}
		//固定数量线程池
		ExecutorService es2=Executors.newFixedThreadPool(3);
		for(int i=0;i<3;i++){
			es2.execute(new Runnable() {
				
				@Override
				public void run() {
					System.out.println("固定数量线程池"+Thread.currentThread().getName()+"已运行");
				}
			});
		}
		//定期执行线程池
		ExecutorService es3=Executors.newScheduledThreadPool(2);
		for(int i=0;i<3;i++){
			es3.execute(new Runnable() {
				
				@Override
				public void run() {
					System.out.println("定期执行线程池"+Thread.currentThread().getName()+"已运行");
				}
			});
		}
		//单线程线程池
		ExecutorService es4=Executors.newSingleThreadExecutor();
		for(int i=0;i<3;i++){
			es4.submit(new Runnable() {
				
				@Override
				public void run() {
					System.out.println("单线程池"+Thread.currentThread().getName()+"已运行");
				}
			});
		}
		
	}
}
----------------------------------------------------------------------------------
可缓存线程池线程pool-1-thread-3已运行
可缓存线程池线程pool-1-thread-2已运行
可缓存线程池线程pool-1-thread-1已运行
固定数量线程池pool-2-thread-1已运行
固定数量线程池pool-2-thread-2已运行
固定数量线程池pool-2-thread-3已运行
定期执行线程池pool-3-thread-1已运行
定期执行线程池pool-3-thread-1已运行
定期执行线程池pool-3-thread-1已运行
单线程池pool-4-thread-1已运行
单线程池pool-4-thread-1已运行
单线程池pool-4-thread-1已运行

4.线程池的工作流程

线程池刚刚创建之后，里面没有线程。任务队列是作为参数传进来的。不过，就算是有线程线程池也不会立刻执行线程；
当调用execute()方法时，线程池会做出以下判断：
a.如果运行的线程数小于corePoolSize，那么马上创建线程运行这个任务；
b.如果当前线程池中的线程数大于或等于corePoolSize，那么会将这个任务放入队列；
c.如果这个时候队列已满，而正在运行的线程数小于maximumPoolSize，那么还是会创建非核心线程来运行这个任务；反之，如果正在运行的线程数大于或等于maximumPoolSize，那么就会抛出异常RejectExcutionException（Handler拒绝策略）;
d.当一个线程完成后，会在队列头里取得下一个线程执行；
e.当一个线程无事可做，超出一定的时间(keepAliveTime)，线程池会判断，如果运行的线程数大于corePoolSize,那么这个线程将会被结束掉。所以线程数的所有任务完成后，它最终会收缩corePoolSize 的大小。

2.线程池的线程复用

在平时使用线程池的时候，都是以excute(Runnable r)的方式进行的，并不能看出线程池如何维持线程运行或者任何重用线程。so，源码带我们走进神秘的世界：

先看execute(Runnable r)的实现

public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
            /*
			* 线程池加载线程的三个策略：
			* 1.当工作线程数少于corePoolSize 立刻创建新线程运行
			* 2.如果不能创建新线程运行，那么就将该线程加入到等待workQueue队列等待调用执行、
			* 3.如果二次检查recheck线程池停止工作则需要移除线程
			* 4.如果无法提交线程，就需要使用拒绝策略reject
			*/
        int c = ctl.get();
        if (workerCountOf(c) < corePoolSize) {
            if (addWorker(command, true))
                return;
            c = ctl.get();
        }
        if (isRunning(c) && workQueue.offer(command)) {
            int recheck = ctl.get();
            if (! isRunning(recheck) && remove(command))
                reject(command);
            else if (workerCountOf(recheck) == 0)
                addWorker(null, false);
        }
        else if (!addWorker(command, false))
            reject(command);
    }

可以看出来，在execute()方法中，使用到的执行线程的方法是addWorker(command,true)，他才是重用线程的重点，所以我们可以跟进去看一下addWorker()方法：

首先，addWorker()方法属于ThreadPoolExecutor的一个内部类

private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable{
        Worker(Runnable firstTask) {
            setState(-1); // inhibit interrupts until runWorker 线程中断
            this.firstTask = firstTask; //初始化任务
            this.thread = getThreadFactory().newThread(this); //通过线程工厂生产线程
        }
 }

作为一个final的类，worker不支持被继承，也就是说在JDK中只有这一个类可以用来处理线程池中的重用线程；
再来看看addWorker()方法的细节：

/*
* 这里省略一部分代码，原因是 这一部分代码是判断型，用来判断线程池状态，其线程是否可以被添加。
* 下面的代码才是重点！！！
*/
private boolean addWorker(Runnable firstTask, boolean core) {
		boolean workerStarted = false;
        boolean workerAdded = false;
        Worker w = null;
        try {
            w = new Worker(firstTask); //将要执行的线程封装进worker对象中
            final Thread t = w.thread; //拿到worker对象中封装的线程
            if (t != null) {
                final ReentrantLock mainLock = this.mainLock;
                mainLock.lock();
                try {
                    // Recheck while holding lock.
                    // Back out on ThreadFactory failure or if
                    // shut down before lock acquired.
                    //再次检验锁 线程工厂 的状态是否符合要求
                    int rs = runStateOf(ctl.get());
					//当获取到的状态码显示线程池关闭或者线程阻断 但firstTask还要运行 
					//那么就抛异常。否则添加worker对象到 HashSet<Worker>中，将workeradd添
					//加状态置为ture表示已经添加线程
                    if (rs < SHUTDOWN ||
                        (rs == SHUTDOWN && firstTask == null)) {
                        if (t.isAlive()) // precheck that t is startable
                            throw new IllegalThreadStateException();
                        workers.add(w);
                        int s = workers.size();
                        if (s > largestPoolSize)
                            largestPoolSize = s;
                        workerAdded = true;
                    }
                } finally {
                    mainLock.unlock();
                }
                //t.start() => Worker.start()
                //所以就将逻辑转换到worker内部执行
                if (workerAdded) {
                    t.start();
                    workerStarted = true;
                }
            }
        } finally {
            if (! workerStarted)
                addWorkerFailed(w);
        }
        return workerStarted;
    }
}

从上面的代码可以看出，将传入的线程添加工作队列后，执行线程是在worker内部中：

/** Delegates main run loop to outer runWorker  */
        public void run() {
            runWorker(this);
        }
这里的run是重写Runnable里面的run方法，通过调用run执行线程体

在RunWorker方法中传入Worker对象，进行线程重用：

final void runWorker(Worker w) {
        Thread wt = Thread.currentThread(); //拿到线程属性
        Runnable task = w.firstTask; //拿到任务
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
                w.lock();
                // If pool is stopping, ensure thread is interrupted;
                // if not, ensure thread is not interrupted.  This
                // requires a recheck in second case to deal with
                // shutdownNow race while clearing interrupt
                //判断线程池是否停止 并执行相应的拒绝策略
                if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &&
                      runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                    wt.interrupt();
                try {
                    beforeExecute(wt, task);
                    Throwable thrown = null;
                    //好的，这里我们会看见task任务被执行，那么task任务是在何时被拿出来的尼？
                    //答案是在while循环判断的时候 task=getTask()
                    try {
                        task.run();
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        afterExecute(task, thrown);
                    }
                } finally {
                    task = null;
                    w.completedTasks++;
                    w.unlock();
                }
            }
            completedAbruptly = false;
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }

这个方法分为两部分：

一个大的while循环，判断条件是task!=null || (task=getTask())!=null ，task自然就是我们要执行的任务。当 task==null && (task.getTask())==null 的时候，循环结束；循环体里面会执行task.run() ；
线程池一直在运行其实就是while循环一直没有断，所以当有外部任务进来的时候，就可以取得线程并且执行；

最后来看一下getTask()方法，它是重用线程的关键：

private Runnable getTask() {
        boolean timedOut = false; // Did the last poll() time out?

        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);

            // Check if queue empty only if necessary.
            if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
                decrementWorkerCount();
                return null;
            }

            int wc = workerCountOf(c);

            // Are workers subject to culling?
            boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

            if ((wc > maximumPoolSize || (timed && timedOut))
                && (wc > 1 || workQueue.isEmpty())) {
                if (compareAndDecrementWorkerCount(c))
                    return null;
                continue;
            }

            try {
                Runnable r = timed ?
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                    workQueue.take();
                if (r != null)
                    return r;
                timedOut = true;
            } catch (InterruptedException retry) {
                timedOut = false;
            }
        }
    }

除过前面所有的判断，获取任务的操作来到了Runnable r = timed ?workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) : workQueue.take();这一步，工作队列workQueue会一直去请求任务，属于核心线程的会一直卡在workQueue.take()方法，直到拿到Runnable然后返回，非核心线程会poll()。如果超出keepAliveTime还没有拿到线程就会返回null，当判断拿到线程即Runnable!=null，则返回Runnable；

从以上代码可以总结getTask()的作用为：如果当前活动线程数大于核心线程数，当去缓存队列中取任务的时候，如果缓存队列中没有任务，在等待keepAliveTime的时长之后还没有任务则返回null，这就意味着runWorker()方法退出，其对应的线程就会被销毁。只要线程池中的线程数大于corePoolSize，则会一直这样执行下去；

总结来说，线程池中的复用原理如下：
1.线程池执行execute(Runnable r)方法，将需要执行的任务传入该方法中；
2.execute()中判断线程符合要求后，调用addWorker(Runnable r,boolean core)；
3.作为内部类Worker利用构造函数可以封装出一个Worker对象包含线程信息；
4.将符合要求的线程加入到HashSet < Workers >中，使用t.start()执行线程；
5.t.start()将逻辑转换到Worker内部类中，重用run()方法，调用runWorker()执行；
6.runWorker()方法中在while循环条件中尝试获取任务；
7.根据任务获取成功或失败来增加或消除线程直到线程数=corePoolSize；

3.线程池中的数量真的是越多越好吗？

答案当然是不行的。当任务需要使用线程池的资源时，比如数据库连接。过多的连接请求线程池执行任务也会导致频繁的上下文切换，CPU消耗大。

IO密集型

cpu使用率较低，程序中出现大量的IO操作占据时间导致线程空余而没有利用，但是却被IO占用着，所以通常就需要开两倍的CPU数的线程，当线程进行IO操作时其他线程可以继续使用CPU，提高CPU的可利用率；所以：
最佳线程数目 = （（线程等待时间+线程CPU时间）/ 线程CPU时间）X CPU数目
CPU密集型

CPU使用率较高（一些复杂运算，逻辑处理等），所以线程数一般只需要等于CPU的数量即可。

在高并发、任务执行短的情况下，设置线程数 = CPU+1，减少线程上下文的切换
在并发不高、任务执行时间长的情况下：

如果是IO密集型，则设置两倍的CPU数量的线程；
如果时执行时间长，则设置的线程数应该和CPU数量一致；

4.线程池中阻塞队列的作用？为什么是先添加队列而不是先创建最大线程？

4.1 使用阻塞队列的原因

1.一般的队列只能保证作为一个有限长度的缓冲区，如果超出这个缓冲区，就无法保留当前的任务；而阻塞队列可以通过阻塞保留住当前想要继续入队的任务；
2.阻塞队列可以保证任务队列中没有任务时阻塞获取任务的线程，使得线程进入wait状态，释放CPU资源；
3.阻塞队列自带阻塞和唤醒功能，不需要再进行其他额外处理，无任务执行时，线程池利用阻塞队列的take()方法挂起，从而保证核心线程的存活、不至于一直占用CPU资源；

4.2 先添加队列的原因

在创建新线程的时候，是要获取全局锁对象，这个时候其他的就得阻塞，影响了整体效率；

我还年轻我很平凡

关注

7
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
线程池工作流程及线程复用原理

Java常用的线程池1.线程池的作用线程池的作用就是限制运行线程的数量；创建一个符合需求的线程池，可以有效的提高系统运行的效率；利用同步队列控制线程的执行与销毁；为什么使用线程池会提高效率？1.减少了创建和销毁线程的次数，每个工作线程都有可能被重复利用；2.根据系统的承载能力，调整线程池中的线程数目，避免开启太多线程；需要注意的是：Java里的线程池的顶级接口是Executor...
复制链接

扫一扫

专栏目录