线程池

 
线程池

      线程池是管理线程的高级技术,通常它提供了如下功能:
  •   通过对线程的管理,更加合理的调配资源。通常,线程池里维护着一组空闲线程,并向外提供,根据系统繁忙程度动态增加或减少空闲线程的数量。比较高级的还提供了自动检测异常线程的功能。
  •   通过维护池中既存线程,可以节省创建线程的开销,尤其是对于web server这类处理频繁,而处理过程又比较快的程序,创建线程的开销是不能忽略的。

    类似在裸机上加OS能够合理管理计算机资源,使用线程池能够低开销且有效的管理线程的生命周期和系统资源,同时提供更为方便易用的接口对外,使得开发更加快速安全。

    对于简单的线程池,可以参考文章《Java 理论与实践: 线程池与工作队列》,这里实现了一个简单的带工作队列(Queue)的线程池,当然,也有一些简单的调度,这里就不再赘述。

 

线程池框架


    相对于jdk1.5中的ThreadPoolExecutor中复杂的调度和规划,上面的例子还稍微简单了些。Doug Lee定义了命令模式的接口Executor,使得线程的执行逻辑和时序逻辑得到了分离,提高了健壮性和可扩张性,使得需求变化时不再是将整个程序重写而只需修改相应的执行逻辑----至于时序逻辑,交给ThreadPool吧,它会帮你搞定一切的。不相信?那不如让我们inside ThreadPoolExecutor去看看它是怎么实现这项神奇的功能。

    首先我们对ThreadPoolExecutor的框架来一个总体的认识,ThreadPoolExecutor继承了AbstractExecutorService,后者实现了ExecutorService接口,同时ExecutorService又是Executor的子接口;也就是说ThreadPoolExecutor其实是一个Executor的实现。如图示。

    ThreadPoolExecutor内部共有5个类,其中RejectExecutionHandler定义了对任务的丢弃方式,它之下有4个实例类。Worker类其实就是在线程池中执行的线程实体,所以它也很重要,可以注意到它被定义为一个内部类,从而可以方便的访问ThreadPoolExecutor类的方法。如图:

jdk <wbr>concurrent <wbr>threadPool---ThreadPoolExecutor原理分析

    这里简单的先介绍一下这些与ThreadPoolExecutor有关的接口或类。Executor已经介绍过了,就是让逻辑分离而做的接口,它定义了抽象方法execute()。而ExecutorService则是负责管理一组任务的服务接口,它的一些实现都已经在其子类AbstractExecutorService中完成了。ThreadPoolExecutor需要实现execute()和shutdown()等抽象方法。

    

ThreadPoolExecutor代码分析


    execute()是整个线程池最核心的方法,可以说线程池对任务的调度就是在这里实现的。来看for循环,如果当前线程池正在运行,则用reject策略将任务reject掉;如果当前线程数小于核心池数量,就new新线程来解决当前任务,注意即使是活动线程空闲也不会使用它们;一旦线程数超过核心池数量,则不再new新线程,而是向队列中添加任务,这里也分成功失败(队列满则失败),成功说明当前线程数满足当前任务数;失败就表示核心池数量的线程已经不能满足当前任务数了,这时就会启用后备线程;addIfUnderMaximumPoolSize(command)返回的结果其实有三种情况:1.新建线程处理当前任务;2.未新建成功;3.新建线程处理了队列里的任务,但未处理当前任务,前两种情况都在后面用if进行了判断,只有最后的情况是需要for循环重新处理的。

    public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
        for (;;) {
            if (runState != RUNNING) {
                reject(command);
                return;
            }
            if (poolSize < corePoolSize && addIfUnderCorePoolSize(command))
                return;
            if (workQueue.offer(command))
                return;
            Runnable r = addIfUnderMaximumPoolSize(command);
            if (r == command)
                return;
            if (r == null) {
                reject(command);
                return;
            }
            // else retry
        }
    }

    

    另外,addThread方法在整个类中也比较重要,是添加线程的入口方法,在上面提到的addIfUnderCorePoolSize和addIfUnderMaximumPoolSize中都使用过,此外两个重要的方法workDone和setPoolSize也分别用到了,因此,得记住这个方法的作用。我们来看看这个方法的实现。前面几句的确很混淆,实际上就是用Runnable生产了一个工人,而线程工厂使用了工人生产出一个线程,再用工人内部的一个属性指向这个线程。其实这里所做的是让t和w都有互相的引用,以便今后操作。

    private Thread addThread(Runnable firstTask) {
        Worker w = new Worker(firstTask);
        Thread t = threadFactory.newThread(w);
        if (t != null) {
            w.thread = t;
            workers.add(w);
            int nt = ++poolSize;
            if (nt > largestPoolSize)
                largestPoolSize = nt;
        }
        return t;
    }

 

    理解了这两个方法,就大概理解了线程的调度策略,但是我们仍然没提到线程的生命周期,线程是何时开始何时结束的呢?一定别漏了addIfUnderCorePoolSize和addIfUnderMaximumPoolSize,线程就是在这里开始的。至于结束,可不要错过shutdown和shutdownNow方法。以shutdownNow为例(shutdown类似),判断了安全之后有个if判断当前是否还存在工人。如果还有工人则设置状态及立即中断所有worker(使用interrupt),否则直接中止,最后将工作队列的残留数直接返回。通过这个方法的分析,我们可以得知,如果需要中止线程池,希望回收资源时,可以调用这个方法(或shutdown),而中止的形式是以线程的interrupt来实现的。到此,线程怎么生存的就弄清楚了。

public List shutdownNow() {
        // Almost the same code as shutdown()
 SecurityManager security = System.getSecurityManager();
 if (security != null)
            java.security.AccessController.checkPermission(shutdownPerm);

        boolean fullyTerminated = false;
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            if (workers.size() > 0) {
                if (security != null) {
                    for (Worker w: workers)
                        security.checkAccess(w.thread);
                }

                int state = runState;
                if (state != TERMINATED)
                    runState = STOP;
                try {
                    for (Worker w : workers)
                        w.interruptNow();
                } catch(SecurityException se) {
                    runState = state; // back out;
                    throw se;
                }
            }
            else { // If no workers, trigger full termination now
                fullyTerminated = true;
                runState = TERMINATED;
                termination.signalAll();
            }
        } finally {
            mainLock.unlock();
        }
        if (fullyTerminated)
            terminated();
        return Arrays.asList(workQueue.toArray(EMPTY_RUNNABLE_ARRAY));
    }

 

    剩下的主要方法就是对一些重要属性的set和get方法,由于可能会是多个线程并发调度,所以这些方法大都上了锁。另外需要注意的是beforeExecute,afterExecute,terminated三个方法,它们都是protected,并且都没有实现,可以知道这是留着给子类实现的,beforeExecute和afterExecute是在Worker类runTask()中被调用的,terminated方法则在刚刚分析过的shutdownNow中被调用。具体内容可以参看源码。

   

Worker线程


   

    接下来,我们再深入讨论如何执行任务的细节,这里集中讨论Worker这个内部类是如何来执行一个任务的。首先来看run方法,while循环主要就是保证一直在做未完成的任务,getTask主要所做的就是从工作队列中得到一个Runnable。之后就是调用runTask。Thread.interrupted()主要作用是清除中断标志,就是说如果之前中断了,现在要再启动必须先清除中断标志。这里用到了before/after模式,在run之前做beforeExecute,而之后做afterExecute,重要的是ran,这个标志是用来做什么的呢,这是用来回滚的,如果在catch中ran=false,说明是task.run出错,这样势必没有执行到afterExecute,所以需要在catch中需要再run afterExecute。这段代码让我们对工人线程如何工作有了比较清晰的死路。

        private void runTask(Runnable task) {
            final ReentrantLock runLock = this.runLock;
            runLock.lock();
            try {
                if (runState == STOP)
                    return;

                Thread.interrupted();

                boolean ran = false;
                beforeExecute(thread, task);
                try {
                    task.run();
                    ran = true;
                    afterExecute(task, null);
                    ++completedTasks;
                } catch(RuntimeException ex) {
                    if (!ran)
                        afterExecute(task, ex);
                    throw ex;
                }
            } finally {
                runLock.unlock();
            }
        }

        public void run() {
            try {
                Runnable task = firstTask;
                firstTask = null;
                while (task != null || (task = getTask()) != null) {
                    runTask(task);
                    task = null; // unnecessary but can help GC
                }
            } catch(InterruptedException ie) {
                // fall through
            } finally {
                workerDone(this);
            }
        }

 

    上面用到的getTask是ThreadPoolExecutor,可以看看getTask是用什么样的策略获得一个Runnable。如果还没超过核心池大小,就用take;如果超过了,就用poll。什么意思呢,如果没超过核心池,说明任务很少,我们就用take,即使队列被锁住了,无论如何也要等到一个任务;如果超过核心池,说明任务已经非常多了,工人线程等待一段时间还没有得到一个任务,就马上返回不再等下去。注意两个if判断之后还有一种可能,即等待一定时间后队列已经收缩到核心池以下,这时就需要for循环使用核心池获取任务的策略。

    Runnable getTask() throws InterruptedException {
        for (;;) {
            switch(runState) {
            case RUNNING: {
                if (poolSize <= corePoolSize)   // untimed wait if core
                    return workQueue.take();
                long timeout = keepAliveTime;
                if (timeout <= 0) // die immediately for 0 timeout
                    return null;
                Runnable r =  workQueue.poll(timeout, TimeUnit.NANOSECONDS);
                if (r != null)
                    return r;
                if (poolSize > corePoolSize) // timed out
                    return null;
                // else, after timeout, pool shrank so shouldn't die, so retry
                break;
            }

           ……

 

线程池与命令模式


    命令模式在设计中是相对常用的模式。典型的例子是点菜,作为客户(client)是命令的创建者;服务员是命令的发起者(invoker);而账单就是命令(command);厨师则是命令的执行者(receiver)。其实就是客户将菜单交给厨师的过程。为了解耦客户和厨师,我们有了服务员。现实中也一样,似乎没看到客户直接拿着菜单就去找厨师了。如图,这里省略了客户将Command塞给invoker的过程。

    我们设计时往往将client和receiver紧耦合起来,比如在client中直接就receiver.do(message),这样的设计不能适应稍微的变更。而使用了命令模式之后,消息被解耦成为单独的Command对象,这样,Command可以动态装载的并且能够实行一系列在其上的操作,如undo等等。而这个消息也可以在多个对象之间共享。

jdk <wbr>concurrent <wbr>threadPool---ThreadPoolExecutor原理分析

    对应与命令模式,线程池是如何做的呢?你一定猜到了,Runnable就是Command接口,在外面创建的Runnable实例就是ConcreteCommand,那么invoker呢?当然是ThreadPoolExecutor了。也就是说,在jdk中已经实现了差不多全部命令对象的角色,我们需要做的就是创建继承Runnable的ConcreteCommand,调用ThreadPoolExecutor.execute(ConcreteCommand)激发命令,则线程就能自动调度了,因为调度的逻辑已经写在ThreadPoolExecutor中。那么我们还需要实现Receiver吗?其实Receiver就是命令的执行者。而这里,命令的执行者其实是那个Worker线程。可以看到,jdk已经将可复用性做到了极致。

    从这个例子可以看出,Runnable在ThreadPoolExecutor中其实是解耦外部的命令创建者和Worker的,否则全写在一起也就没有线程池调度的概念了。Executor其实是定义了Invoker的setCommand接口(即execute),由于invoker的出现,client就彻底的和receiver分离开了。

 

 

JDK1.5中的线程池(java.util.concurrent.ThreadPoolExecutor)使用简介

在多线程大师Doug Lea的贡献下,在JDK1.5中加入了许多对并发特性的支持,例如:线程池。

一、简介
线程池类为 java.util.concurrent.ThreadPoolExecutor,常用构造方法为:

ThreadPoolExecutor(int corePoolSize, int maximumPoolSize,
long keepAliveTime, TimeUnit unit,
BlockingQueue<Runnable> workQueue,
RejectedExecutionHandler handler)

corePoolSize: 线程池维护线程的最少数量
maximumPoolSize:线程池维护线程的最大数量
keepAliveTime: 线程池维护线程所允许的空闲时间
unit: 线程池维护线程所允许的空闲时间的单位
workQueue: 线程池所使用的缓冲队列
handler: 线程池对拒绝任务的处理策略

一个任务通过 execute(Runnable)方法被添加到线程池,任务就是一个 Runnable类型的对象,任务的执行方法就是 Runnable类型对象的run()方法。

当一个任务通过execute(Runnable)方法欲添加到线程池时:

如果此时线程池中的数量小于corePoolSize,即使线程池中的线程都处于空闲状态,也要创建新的线程来处理被添加的任务。

如果此时线程池中的数量等于 corePoolSize,但是缓冲队列 workQueue未满,那么任务被放入缓冲队列。

如果此时线程池中的数量大于corePoolSize,缓冲队列workQueue满,并且线程池中的数量小于maximumPoolSize,建新的线程来处理被添加的任务。

如果此时线程池中的数量大于corePoolSize,缓冲队列workQueue满,并且线程池中的数量等于maximumPoolSize,那么通过 handler所指定的策略来处理此任务。

也就是:处理任务的优先级为:
核心线程corePoolSize、任务队列workQueue、最大线程maximumPoolSize,如果三者都满了,使用handler处理被拒绝的任务。

当线程池中的线程数量大于 corePoolSize时,如果某线程空闲时间超过keepAliveTime,线程将被终止。这样,线程池可以动态的调整池中的线程数。

unit可选的参数为java.util.concurrent.TimeUnit中的几个静态属性:
NANOSECONDS、MICROSECONDS、MILLISECONDS、SECONDS。

workQueue我常用的是:java.util.concurrent.ArrayBlockingQueue

handler有四个选择:
ThreadPoolExecutor.AbortPolicy()
抛出java.util.concurrent.RejectedExecutionException异常
ThreadPoolExecutor.CallerRunsPolicy()
重试添加当前的任务,他会自动重复调用execute()方法
ThreadPoolExecutor.DiscardOldestPolicy()
抛弃旧的任务
ThreadPoolExecutor.DiscardPolicy()
抛弃当前的任务


二、一般用法举例
//------------------------------------------------------------
//TestThreadPool.java
//package cn.simplelife.exercise;

import java.io.Serializable;
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

public class TestThreadPool {

private static int produceTaskSleepTime = 2;
private static int consumeTaskSleepTime = 2000;
private static int produceTaskMaxNumber = 10;

public static void main(String[] args) {

//构造一个线程池
ThreadPoolExecutor threadPool = new ThreadPoolExecutor(2, 4, 3,
TimeUnit.SECONDS, new ArrayBlockingQueue<Runnable>(3),
new ThreadPoolExecutor.DiscardOldestPolicy());

for(int i=1;i<=produceTaskMaxNumber;i++){
try {
//产生一个任务,并将其加入到线程池
String task = "task@ " + i;
System.out.println("put " + task);
threadPool.execute(new ThreadPoolTask(task));

//便于观察,等待一段时间
Thread.sleep(produceTaskSleepTime);
} catch (Exception e) {
e.printStackTrace();
}
}
}

/**
* 线程池执行的任务
* @author hdpan
*/
public static class ThreadPoolTask implements Runnable,Serializable{
private static final long serialVersionUID = 0;
//保存任务所需要的数据
private Object threadPoolTaskData;

ThreadPoolTask(Object tasks){
this.threadPoolTaskData = tasks;
}
public void run(){
//处理一个任务,这里的处理方式太简单了,仅仅是一个打印语句
System.out.println("start .."+threadPoolTaskData);
try {
便于观察,等待一段时间
Thread.sleep(consumeTaskSleepTime);
} catch (Exception e) {
e.printStackTrace();
}
threadPoolTaskData = null;
}
public Object getTask(){
return this.threadPoolTaskData;
}
}
}
//------------------------------------------------------------
说明:
1、在这段程序中,一个任务就是一个Runnable类型的对象,也就是一个ThreadPoolTask类型的对象。

2、一般来说任务除了处理方式外,还需要处理的数据,处理的数据通过构造方法传给任务。

3、在这段程序中,main()方法相当于一个残忍的领导,他派发出许多任务,丢给一个叫 threadPool的任劳任怨的小组来做。

这个小组里面队员至少有两个,如果他们两个忙不过来,任务就被放到任务列表里面。

如果积压的任务过多,多到任务列表都装不下(超过3个)的时候,就雇佣新的队员来帮忙。但是基于成本的考虑,不能雇佣太多的队员,至多只能雇佣 4个。

如果四个队员都在忙时,再有新的任务,这个小组就处理不了了,任务就会被通过一种策略来处理,我们的处理方式是不停的派发,直到接受这个任务为止(更残忍!呵呵)。

因为队员工作是需要成本的,如果工作很闲,闲到 3SECONDS都没有新的任务了,那么有的队员就会被解雇了,但是,为了小组的正常运转,即使工作再闲,小组的队员也不能少于两个。

4、通过调整 produceTaskSleepTime和 consumeTaskSleepTime的大小来实现对派发任务和处理任务的速度的控制,改变这两个值就可以观察不同速率下程序的工作情况。

5、通过调整4中所指的数据,再加上调整任务丢弃策略,换上其他三种策略,就可以看出不同策略下的不同处理方式。

6、对于其他的使用方法,参看jdk的帮助,很容易理解和使用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值