线程池

最新推荐文章于 2023-05-15 14:52:51 发布

caocaozhuce

最新推荐文章于 2023-05-15 14:52:51 发布

阅读量86

点赞数

分类专栏： java

java 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

http://blog.sina.com.cn/s/blog_58adc9e701000a5b.html

http://blog.csdn.net/robage/article/details/1620691

线程池

线程池是管理线程的高级技术，通常它提供了如下功能：

通过对线程的管理，更加合理的调配资源。通常，线程池里维护着一组空闲线程，并向外提供，根据系统繁忙程度动态增加或减少空闲线程的数量。比较高级的还提供了自动检测异常线程的功能。
通过维护池中既存线程，可以节省创建线程的开销，尤其是对于web server这类处理频繁，而处理过程又比较快的程序，创建线程的开销是不能忽略的。

类似在裸机上加OS能够合理管理计算机资源，使用线程池能够低开销且有效的管理线程的生命周期和系统资源，同时提供更为方便易用的接口对外，使得开发更加快速安全。

对于简单的线程池，可以参考文章《Java 理论与实践: 线程池与工作队列》，这里实现了一个简单的带工作队列（Queue）的线程池，当然，也有一些简单的调度，这里就不再赘述。

线程池框架

相对于jdk1.5中的ThreadPoolExecutor中复杂的调度和规划，上面的例子还稍微简单了些。Doug Lee定义了命令模式的接口Executor，使得线程的执行逻辑和时序逻辑得到了分离，提高了健壮性和可扩张性，使得需求变化时不再是将整个程序重写而只需修改相应的执行逻辑----至于时序逻辑，交给ThreadPool吧，它会帮你搞定一切的。不相信？那不如让我们inside ThreadPoolExecutor去看看它是怎么实现这项神奇的功能。

首先我们对ThreadPoolExecutor的框架来一个总体的认识，ThreadPoolExecutor继承了AbstractExecutorService，后者实现了ExecutorService接口，同时ExecutorService又是Executor的子接口;也就是说ThreadPoolExecutor其实是一个Executor的实现。如图示。

ThreadPoolExecutor内部共有5个类，其中RejectExecutionHandler定义了对任务的丢弃方式，它之下有4个实例类。Worker类其实就是在线程池中执行的线程实体，所以它也很重要，可以注意到它被定义为一个内部类，从而可以方便的访问ThreadPoolExecutor类的方法。如图：

这里简单的先介绍一下这些与ThreadPoolExecutor有关的接口或类。Executor已经介绍过了，就是让逻辑分离而做的接口，它定义了抽象方法execute()。而ExecutorService则是负责管理一组任务的服务接口，它的一些实现都已经在其子类AbstractExecutorService中完成了。ThreadPoolExecutor需要实现execute()和shutdown()等抽象方法。

ThreadPoolExecutor代码分析

execute()是整个线程池最核心的方法，可以说线程池对任务的调度就是在这里实现的。来看for循环，如果当前线程池正在运行，则用reject策略将任务reject掉；如果当前线程数小于核心池数量，就new新线程来解决当前任务，注意即使是活动线程空闲也不会使用它们；一旦线程数超过核心池数量，则不再new新线程，而是向队列中添加任务，这里也分成功失败（队列满则失败），成功说明当前线程数满足当前任务数；失败就表示核心池数量的线程已经不能满足当前任务数了，这时就会启用后备线程；addIfUnderMaximumPoolSize(command)返回的结果其实有三种情况：1.新建线程处理当前任务；2.未新建成功；3.新建线程处理了队列里的任务，但未处理当前任务，前两种情况都在后面用if进行了判断，只有最后的情况是需要for循环重新处理的。

    public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
        for (;;) {
            if (runState != RUNNING) {
                reject(command);
                return;
            }
            if (poolSize < corePoolSize && addIfUnderCorePoolSize(command))
                return;
            if (workQueue.offer(command))
                return;
            Runnable r = addIfUnderMaximumPoolSize(command);
            if (r == command)
                return;
            if (r == null) {
                reject(command);
                return;
            }
            // else retry
        }
    }

另外，addThread方法在整个类中也比较重要，是添加线程的入口方法，在上面提到的addIfUnderCorePoolSize和addIfUnderMaximumPoolSize中都使用过，此外两个重要的方法workDone和setPoolSize也分别用到了，因此，得记住这个方法的作用。我们来看看这个方法的实现。前面几句的确很混淆，实际上就是用Runnable生产了一个工人，而线程工厂使用了工人生产出一个线程，再用工人内部的一个属性指向这个线程。其实这里所做的是让t和w都有互相的引用，以便今后操作。

    private Thread addThread(Runnable firstTask) {
        Worker w = new Worker(firstTask);
        Thread t = threadFactory.newThread(w);
        if (t != null) {
            w.thread = t;
            workers.add(w);
            int nt = ++poolSize;
            if (nt > largestPoolSize)
                largestPoolSize = nt;
        }
        return t;
    }

理解了这两个方法，就大概理解了线程的调度策略，但是我们仍然没提到线程的生命周期，线程是何时开始何时结束的呢？一定别漏了addIfUnderCorePoolSize和addIfUnderMaximumPoolSize，线程就是在这里开始的。至于结束，可不要错过shutdown和shutdownNow方法。以shutdownNow为例（shutdown类似），判断了安全之后有个if判断当前是否还存在工人。如果还有工人则设置状态及立即中断所有worker（使用interrupt），否则直接中止，最后将工作队列的残留数直接返回。通过这个方法的分析，我们可以得知，如果需要中止线程池，希望回收资源时，可以调用这个方法（或shutdown），而中止的形式是以线程的interrupt来实现的。到此，线程怎么生存的就弄清楚了。

public List shutdownNow() {
// Almost the same code as shutdown()
SecurityManager security = System.getSecurityManager();
if (security != null)
java.security.AccessController.checkPermission(shutdownPerm);

        boolean fullyTerminated = false;
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            if (workers.size() > 0) {
                if (security != null) {
                    for (Worker w: workers)
                        security.checkAccess(w.thread);
                }

                int state = runState;
                if (state != TERMINATED)
                    runState = STOP;
                try {
                    for (Worker w : workers)
                        w.interruptNow();
                } catch(SecurityException se) {
                    runState = state; // back out;
                    throw se;
                }
            }
            else { // If no workers, trigger full termination now
                fullyTerminated = true;
                runState = TERMINATED;
                termination.signalAll();
            }
        } finally {
            mainLock.unlock();
        }
        if (fullyTerminated)
            terminated();
        return Arrays.asList(workQueue.toArray(EMPTY_RUNNABLE_ARRAY));
    }

剩下的主要方法就是对一些重要属性的set和get方法，由于可能会是多个线程并发调度，所以这些方法大都上了锁。另外需要注意的是beforeExecute,afterExecute,terminated三个方法，它们都是protected,并且都没有实现，可以知道这是留着给子类实现的，beforeExecute和afterExecute是在Worker类runTask()中被调用的，terminated方法则在刚刚分析过的shutdownNow中被调用。具体内容可以参看源码。

Worker线程

接下来，我们再深入讨论如何执行任务的细节，这里集中讨论Worker这个内部类是如何来执行一个任务的。首先来看run方法，while循环主要就是保证一直在做未完成的任务，getTask主要所做的就是从工作队列中得到一个Runnable。之后就是调用runTask。Thread.interrupted()主要作用是清除中断标志，就是说如果之前中断了，现在要再启动必须先清除中断标志。这里用到了before/after模式，在run之前做beforeExecute，而之后做afterExecute，重要的是ran，这个标志是用来做什么的呢，这是用来回滚的，如果在catch中ran=false,说明是task.run出错，这样势必没有执行到afterExecute，所以需要在catch中需要再run afterExecute。这段代码让我们对工人线程如何工作有了比较清晰的死路。

        private void runTask(Runnable task) {
            final ReentrantLock runLock = this.runLock;
            runLock.lock();
            try {
                if (runState == STOP)
                    return;

Thread.interrupted();

                boolean ran = false;
                beforeExecute(thread, task);
                try {
                    task.run();
                    ran = true;
                    afterExecute(task, null);
                    ++completedTasks;
                } catch(RuntimeException ex) {
                    if (!ran)
                        afterExecute(task, ex);
                    throw ex;
                }
            } finally {
                runLock.unlock();
            }
        }
        public void run() {
            try {
                Runnable task = firstTask;
                firstTask = null;
                while (task != null || (task = getTask()) != null) {
                    runTask(task);
                    task = null; // unnecessary but can help GC
                }
            } catch(InterruptedException ie) {
                // fall through
            } finally {
                workerDone(this);
            }
        }

上面用到的getTask是ThreadPoolExecutor，可以看看getTask是用什么样的策略获得一个Runnable。如果还没超过核心池大小，就用take；如果超过了，就用poll。什么意思呢，如果没超过核心池，说明任务很少，我们就用take，即使队列被锁住了，无论如何也要等到一个任务；如果超过核心池，说明任务已经非常多了，工人线程等待一段时间还没有得到一个任务，就马上返回不再等下去。注意两个if判断之后还有一种可能，即等待一定时间后队列已经收缩到核心池以下，这时就需要for循环使用核心池获取任务的策略。

    Runnable getTask() throws InterruptedException {
        for (;;) {
            switch(runState) {
            case RUNNING: {
                if (poolSize <= corePoolSize)   // untimed wait if core
                    return workQueue.take();
                long timeout = keepAliveTime;
                if (timeout <= 0) // die immediately for 0 timeout
                    return null;
                Runnable r = workQueue.poll(timeout, TimeUnit.NANOSECONDS);
                if (r != null)
                    return r;
                if (poolSize > corePoolSize) // timed out
                    return null;
                // else, after timeout, pool shrank so shouldn't die, so retry
                break;
            }

……

线程池与命令模式

命令模式在设计中是相对常用的模式。典型的例子是点菜，作为客户(client)是命令的创建者；服务员是命令的发起者(invoker)；而账单就是命令（command）；厨师则是命令的执行者（receiver）。其实就是客户将菜单交给厨师的过程。为了解耦客户和厨师，我们有了服务员。现实中也一样，似乎没看到客户直接拿着菜单就去找厨师了。如图，这里省略了客户将Command塞给invoker的过程。

我们设计时往往将client和receiver紧耦合起来，比如在client中直接就receiver.do(message),这样的设计不能适应稍微的变更。而使用了命令模式之后，消息被解耦成为单独的Command对象，这样，Command可以动态装载的并且能够实行一系列在其上的操作，如undo等等。而这个消息也可以在多个对象之间共享。

对应与命令模式，线程池是如何做的呢？你一定猜到了，Runnable就是Command接口，在外面创建的Runnable实例就是ConcreteCommand，那么invoker呢？当然是ThreadPoolExecutor了。也就是说，在jdk中已经实现了差不多全部命令对象的角色，我们需要做的就是创建继承Runnable的ConcreteCommand，调用ThreadPoolExecutor.execute(ConcreteCommand)激发命令，则线程就能自动调度了，因为调度的逻辑已经写在ThreadPoolExecutor中。那么我们还需要实现Receiver吗？其实Receiver就是命令的执行者。而这里，命令的执行者其实是那个Worker线程。可以看到，jdk已经将可复用性做到了极致。

从这个例子可以看出，Runnable在ThreadPoolExecutor中其实是解耦外部的命令创建者和Worker的，否则全写在一起也就没有线程池调度的概念了。Executor其实是定义了Invoker的setCommand接口（即execute），由于invoker的出现，client就彻底的和receiver分离开了。

JDK1.5中的线程池(java.util.concurrent.ThreadPoolExecutor)使用简介

在多线程大师Doug Lea的贡献下，在JDK1.5中加入了许多对并发特性的支持，例如：线程池。

一、简介
线程池类为 java.util.concurrent.ThreadPoolExecutor，常用构造方法为：

ThreadPoolExecutor(int corePoolSize, int maximumPoolSize,
long keepAliveTime, TimeUnit unit,
BlockingQueue<Runnable> workQueue,
RejectedExecutionHandler handler)

corePoolSize：线程池维护线程的最少数量
maximumPoolSize：线程池维护线程的最大数量
keepAliveTime：线程池维护线程所允许的空闲时间
unit：线程池维护线程所允许的空闲时间的单位
workQueue：线程池所使用的缓冲队列
handler：线程池对拒绝任务的处理策略

一个任务通过 execute(Runnable)方法被添加到线程池，任务就是一个 Runnable类型的对象，任务的执行方法就是 Runnable类型对象的run()方法。

当一个任务通过execute(Runnable)方法欲添加到线程池时：

如果此时线程池中的数量小于corePoolSize，即使线程池中的线程都处于空闲状态，也要创建新的线程来处理被添加的任务。

如果此时线程池中的数量等于 corePoolSize，但是缓冲队列 workQueue未满，那么任务被放入缓冲队列。

如果此时线程池中的数量大于corePoolSize，缓冲队列workQueue满，并且线程池中的数量小于maximumPoolSize，建新的线程来处理被添加的任务。

如果此时线程池中的数量大于corePoolSize，缓冲队列workQueue满，并且线程池中的数量等于maximumPoolSize，那么通过 handler所指定的策略来处理此任务。

也就是：处理任务的优先级为：
核心线程corePoolSize、任务队列workQueue、最大线程maximumPoolSize，如果三者都满了，使用handler处理被拒绝的任务。

当线程池中的线程数量大于 corePoolSize时，如果某线程空闲时间超过keepAliveTime，线程将被终止。这样，线程池可以动态的调整池中的线程数。

unit可选的参数为java.util.concurrent.TimeUnit中的几个静态属性：
NANOSECONDS、MICROSECONDS、MILLISECONDS、SECONDS。

workQueue我常用的是：java.util.concurrent.ArrayBlockingQueue

handler有四个选择：
ThreadPoolExecutor.AbortPolicy()
抛出java.util.concurrent.RejectedExecutionException异常
ThreadPoolExecutor.CallerRunsPolicy()
重试添加当前的任务，他会自动重复调用execute()方法
ThreadPoolExecutor.DiscardOldestPolicy()
抛弃旧的任务
ThreadPoolExecutor.DiscardPolicy()
抛弃当前的任务

二、一般用法举例
//------------------------------------------------------------
//TestThreadPool.java
//package cn.simplelife.exercise;

import java.io.Serializable;
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

public class TestThreadPool {

private static int produceTaskSleepTime = 2;
private static int consumeTaskSleepTime = 2000;
private static int produceTaskMaxNumber = 10;

public static void main(String[] args) {

//构造一个线程池
ThreadPoolExecutor threadPool = new ThreadPoolExecutor(2, 4, 3,
TimeUnit.SECONDS, new ArrayBlockingQueue<Runnable>(3),
new ThreadPoolExecutor.DiscardOldestPolicy());

for(int i=1;i<=produceTaskMaxNumber;i++){
try {
//产生一个任务，并将其加入到线程池
String task = "task@ " + i;
System.out.println("put " + task);
threadPool.execute(new ThreadPoolTask(task));

//便于观察，等待一段时间
Thread.sleep(produceTaskSleepTime);
} catch (Exception e) {
e.printStackTrace();
}
}
}

/**
* 线程池执行的任务
* @author hdpan
*/
public static class ThreadPoolTask implements Runnable,Serializable{
private static final long serialVersionUID = 0;
//保存任务所需要的数据
private Object threadPoolTaskData;

ThreadPoolTask(Object tasks){
this.threadPoolTaskData = tasks;
}
public void run(){
//处理一个任务，这里的处理方式太简单了，仅仅是一个打印语句
System.out.println("start .."+threadPoolTaskData);
try {
便于观察，等待一段时间
Thread.sleep(consumeTaskSleepTime);
} catch (Exception e) {
e.printStackTrace();
}
threadPoolTaskData = null;
}
public Object getTask(){
return this.threadPoolTaskData;
}
}
}
//------------------------------------------------------------
说明：
1、在这段程序中，一个任务就是一个Runnable类型的对象，也就是一个ThreadPoolTask类型的对象。

2、一般来说任务除了处理方式外，还需要处理的数据，处理的数据通过构造方法传给任务。

3、在这段程序中，main()方法相当于一个残忍的领导，他派发出许多任务，丢给一个叫 threadPool的任劳任怨的小组来做。

这个小组里面队员至少有两个，如果他们两个忙不过来，任务就被放到任务列表里面。

如果积压的任务过多，多到任务列表都装不下(超过3个)的时候，就雇佣新的队员来帮忙。但是基于成本的考虑，不能雇佣太多的队员，至多只能雇佣 4个。

如果四个队员都在忙时，再有新的任务，这个小组就处理不了了，任务就会被通过一种策略来处理，我们的处理方式是不停的派发，直到接受这个任务为止(更残忍！呵呵)。

因为队员工作是需要成本的，如果工作很闲，闲到 3SECONDS都没有新的任务了，那么有的队员就会被解雇了，但是，为了小组的正常运转，即使工作再闲，小组的队员也不能少于两个。

4、通过调整 produceTaskSleepTime和 consumeTaskSleepTime的大小来实现对派发任务和处理任务的速度的控制，改变这两个值就可以观察不同速率下程序的工作情况。

5、通过调整4中所指的数据，再加上调整任务丢弃策略，换上其他三种策略，就可以看出不同策略下的不同处理方式。

6、对于其他的使用方法，参看jdk的帮助，很容易理解和使用。

caocaozhuce

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
线程池

http://blog.sina.com.cn/s/blog_58adc9e701000a5b.htmlhttp://blog.csdn.net/robage/article/details/1620691 线程池线程池是管理线程的高级技术，通常它提供了如下功能：通过对线程的管理，更加合理的调配资源。通常，线程池里维护着一组空闲线程，并向外提供，根据
复制链接

扫一扫