java并发编程(7) 共享模型之工具 - JDK中的线程池


前言

从(7)开始讨论一些工具,这篇文章讨论JDK中的线程池。文章根据《Java并发编程的艺术》这本书以及黑马的视频 黑马多线程 做的笔记。


1. ThreadPoolExecutor

在这里插入图片描述


1. 线程池状态

ThreadPoolExecutor 使用 int 的高 3 位来表示线程池状态,低 29 位表示线程数量
在这里插入图片描述

  • 从数字上比较,TERMINATED > TIDYING > STOP > SHUTDOWN > RUNNING,这里的第一位是符号位
  • 这些信息存储在一个原子变量 ctl 中,目的是将线程池状态与线程个数合二为一,这样就可以用一次 cas 原子操作 进行赋值
// c 为旧值, ctlOf 返回结果为新值
ctl.compareAndSet(c, ctlOf(targetState, workerCountOf(c))));

// rs 为高 3 位代表线程池状态, wc 为低 29 位代表线程个数,ctl 是使用或操作合并它们
private static int ctlOf(int rs, int wc) { return rs | wc; }



2. 构造方法

public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, ThreadFactory threadFactory, RejectedExecutionHandler handler) {
        this.ctl = new AtomicInteger(ctlOf(-536870912, 0));
        this.mainLock = new ReentrantLock();
        this.workers = new HashSet();
        this.termination = this.mainLock.newCondition();
        if (corePoolSize >= 0 && maximumPoolSize > 0 && maximumPoolSize >= corePoolSize && keepAliveTime >= 0L) {
            if (workQueue != null && threadFactory != null && handler != null) {
                this.corePoolSize = corePoolSize;
                this.maximumPoolSize = maximumPoolSize;
                this.workQueue = workQueue;
                this.keepAliveTime = unit.toNanos(keepAliveTime);
                this.threadFactory = threadFactory;
                this.handler = handler;
            } else {
                throw new NullPointerException();
            }
        } else {
            throw new IllegalArgumentException();
        }
    }

参数:这里的参数比我们自定义的线程池多了一个救急线程,救急线程是在当核心线程和阻塞队列都满了,就是用救急线程来进行处理,处理完之后就销毁

  • corePoolSize 核心线程数目 (最多保留的线程数)
  • maximumPoolSize 最大线程数目,根据核心线程和和救急的线程数加起来得出的
  • keepAliveTime 生存时间 - 针对救急线程。核心线程一直保留在线程池中被使用,救急线程过了生存时间就会被销毁
  • unit 时间单位 - 针对救急线程
  • workQueue 阻塞队列
  • threadFactory 线程工厂 - 可以为线程创建时起个好名字
  • handler 拒绝策略



3. 工作方式

在这里插入图片描述

  1. 线程池中刚开始没有线程,当一个任务提交给线程池后,线程池会创建一个新线程来执行任务。

  2. 当线程数达到 corePoolSize(核心) 并没有线程空闲,这时再加入任务,新加的任务会被加入workQueue(任务队列) 队列排 队,直到有空闲的线程。

  3. 如果队列选择了有界队列,那么任务超过了队列大小时,会创建 maximumPoolSize - corePoolSize 数目的线程来救急。(这里的救急线程数等于最大线程数 - 核心线程数)

  4. 如果线程到达 maximumPoolSize 仍然有新任务这时会执行拒绝策略。这里的拒接策略是在救急线程也执行不完的情况下才拒绝的,和前面自定义的线程池不同。拒绝策略 jdk 提供了 4 种实现,其它著名框架也提供了实现

    • AbortPolicy 让调用者抛出 RejectedExecutionException 异常,这是默认策略
    • CallerRunsPolicy 让调用者运行任务(谁调用的谁来执行)
    • DiscardPolicy 放弃本次任务
    • DiscardOldestPolicy 放弃队列中最早的任务,本任务取而代之,感觉这一应该算是一个替换策略了
    • Dubbo 的实现,在抛出 RejectedExecutionException 异常之前会记录日志,并 dump 线程栈信息,方便定位问题
    • Netty 的实现,是创建一个新线程来执行任务
    • ActiveMQ 的实现,带超时等待(60s)尝试放入队列,类似我们之前自定义的拒绝策略
    • PinPoint 的实现,它使用了一个拒绝策略链,会逐一尝试策略链中每种拒绝策略
  5. 当高峰过去后,超过corePoolSize 的救急线程如果一段时间没有任务做,需要结束节省资源,这个时间由 keepAliveTime 和 unit 来控制。



4. 工厂方法

基于上面这个原理,JDK 的线程池提供了很多的工厂方法来创建各种用途的线程池,但是在真正要用到线程池的时候,建议自己根据需求来设置参数,这也是阿里巴巴开发手册中提到的。


1. newFixedThreadPool

里面的构造方法

public static ExecutorService newFixedThreadPool(int nThreads, ThreadFactory threadFactory) {
   //参数中核心线程数 = 最大线程数
   return new ThreadPoolExecutor(nThreads, nThreads,
                                  0L, TimeUnit.MILLISECONDS,
                                  new LinkedBlockingQueue<Runnable>(),
                                  threadFactory);
}

在这里插入图片描述
从图中可以看到keepAliveTime为0,以及传入的核心线程数等于最大线程数,所以是没有紧急线程的,而且任务队列没有上限,总结以下特点:

  • 核心线程数 == 最大线程数(没有救急线程被创建),因此也无需超时时间
  • 阻塞队列是无界的,可以放任意数量的任务
  • 适用于任务量已知,相对耗时的任务

下面来写下使用的测试代码:其中重写的 newThread 这个方法是用来给线程起名字的

@Slf4j
public class Test2 {
    public static void main(String[] args) {
        //核心线程数 = 最大线程数 = 2
        ExecutorService service = Executors.newFixedThreadPool(2, new ThreadFactory() {
            private AtomicInteger t = new AtomicInteger(1);
            @Override
            public Thread newThread(Runnable r) {
                return new Thread(r, "mypool_t-" + t.getAndIncrement());
            }
        });
        service.execute(()->{
            log.debug("1");
        });
        service.execute(()->{
            log.debug("2");
        });
        service.execute(()->{
            log.debug("3");
        });
//        DEBUG [mypool_t-1] (21:27:21,196) (Test2.java:30) - 1
//        DEBUG [mypool_t-2] (21:27:21,196) (Test2.java:33) - 2
//        DEBUG [mypool_t-1] (21:27:21,198) (Test2.java:36) - 3
    }
}



2. newCachedThreadPool

public static ExecutorService newCachedThreadPool(ThreadFactory threadFactory) {
	   return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
	                                   60L, TimeUnit.SECONDS,
	                                   new SynchronousQueue<Runnable>(),
	                                   threadFactory);
	}

先来看构造方法里面的参数:

  • corePoolSize 核心线程数:0
  • maximumPoolSize 最大线程数:Integer 的最大值
  • keepAliveTime 救急线程的生存时间:60L
  • 时间单位:S
  • 任务队列:SynchronousQueue
  • 线程工厂
  • 没有传入的参数:拒绝策略,使用默认的 AbortPolicy

总结上面的参数,可以看到以下特点:

  • 核心线程数是 0, 最大线程数是 Integer.MAX_VALUE,救急线程的空闲生存时间是 60s,意味着

    • 全部都是救急线程(60s 后可以回收)
    • 救急线程可以无限创建
  • 队列采用了 SynchronousQueue 实现特点是,它没有容量,没有线程来取是放不进去的(一手交钱、一手交货)


下面来看一个例子,测试 SynchronousQueue 这个队列的工作机制:

@Slf4j
public class Test3 {
    public static void main(String[] args) {
        SynchronousQueue<Integer> integers = new SynchronousQueue<>();
        new Thread(() -> {
            try {
                log.debug("putting {} ", 1);
                integers.put(1);
                log.debug("{} putted...", 1);

                log.debug("putting...{} ", 2);
                integers.put(2);
                log.debug("{} putted...", 2);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        },"t1").start();

        sleep.mySleep(1);

        new Thread(() -> {
            try {
                log.debug("taking {}", 1);
                integers.take();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        },"t2").start();

        sleep.mySleep(1);

        new Thread(() -> {
            try {
                log.debug("taking {}", 2);
                integers.take();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        },"t3").start();
    }
    //19:10:02.917 [t1] DEBUG com.jianglianghao.HeiMaJUC.Unit8.Test3 - putting 1 
    //19:10:03.924 [t2] DEBUG com.jianglianghao.HeiMaJUC.Unit8.Test3 - taking 1
    //19:10:03.924 [t1] DEBUG com.jianglianghao.HeiMaJUC.Unit8.Test3 - 1 putted...
    //19:10:03.924 [t1] DEBUG com.jianglianghao.HeiMaJUC.Unit8.Test3 - putting...2 
    //19:10:04.938 [t3] DEBUG com.jianglianghao.HeiMaJUC.Unit8.Test3 - taking 2
    //19:10:04.939 [t1] DEBUG com.jianglianghao.HeiMaJUC.Unit8.Test3 - 2 putted...
}


测试结果如下,这里的线程 t1 负责放数据,t2 和 t3 负责取数,可以看出来,t1 调用 integers.put(1); 的时候,并没有立刻输出 1 putted..., 而是等了一秒线程 t2 来取数的时候才继续往下运行。
在这里插入图片描述

总结:整个线程池表现为线程数会根据任务量不断增长,没有上限,当任务执行完毕,空闲 1分钟后释放线程。 适合任务数比较密集,但每个任务执行时间较短的情况



3. newSingleThreadExecutor

单线程线程池
在这里插入图片描述
特点:

  • 核心线程和最大线程都是 1
  • 没有救济线程
  • 使用的也是默认的拒绝策略:AbortPolicy

使用场景: 希望多个任务排队执行。线程数固定为 1,任务数多于 1 时,会放入无界队列排队。任务执行完毕,这唯一的线程也不会被释放。

区别:

  • 自己创建一个单线程串行执行任务,如果任务执行失败而终止那么没有任何补救措施,而线程池还会新建一个线程,保证池的正常工作

  • Executors.newSingleThreadExecutor() 线程个数始终为1,不能修改

    • FinalizableDelegatedExecutorService 应用的是装饰器模式,只对外暴露了 ExecutorService 接口,因此不能调用 ThreadPoolExecutor 中特有的方法
  • Executors.newFixedThreadPool(1) 初始时为1,以后还可以修改

    • 对外暴露的是 ThreadPoolExecutor 对象,可以强转后调用 setCorePoolSize 等方法进行修改



4. 使用提供的线程池的弊端

  • 对于 newFixedThreadPoolnewSingleThreadExecutor,任务队列是无解的,所以对于大量的任务都会装到队列里面
  • 对于 newCachedThreadPool ,允许创建的最大线程数为 Integer.MAX_VALUE,所以就有可能导致线程过多创建的问题

实际上,阿里巴巴开发手册也给出了线程池要自己定义参数的需求,不要用自带的创建线程池的方法, 可以有效避免 OOM(内存溢出) 的问题,问题还是出自提供的线程池没有对数量进行一个约束。还有一点就是自定义线程池可以根据自己的实际情况,业务需求,电脑的性能来决定到底用多少线程。



5. 提交任务

// 执行任务
void execute(Runnable command);

// 提交任务 task,用返回值 Future 获得任务执行结果
<T> Future<T> submit(Callable<T> task);

// 提交 tasks 中所有任务
<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks)
 throws InterruptedException;
 
// 提交 tasks 中所有任务,带超时时间
<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks,
 long timeout, TimeUnit unit)
 throws InterruptedException;
 
// 提交 tasks 中所有任务,哪个任务先成功执行完毕,返回此任务执行结果,其它任务取消
<T> T invokeAny(Collection<? extends Callable<T>> tasks)
 throws InterruptedException, ExecutionException;

// 提交 tasks 中所有任务,哪个任务先成功执行完毕,返回此任务执行结果,其它任务取消,带超时时间
<T> T invokeAny(Collection<? extends Callable<T>> tasks,
 long timeout, TimeUnit unit) throws InterruptedException, ExecutionException, TimeoutException;



1. submit

submit.get() 可以获取返回的结果

@Slf4j
public class Test4 {
    public static void main(String[] args) throws ExecutionException, InterruptedException {
        ExecutorService pool = Executors.newFixedThreadPool(2);

        Future<String> submit = pool.submit(() -> {
            log.debug("running....");
            Thread.sleep(1000);
            return "ok";
        });
        //获取结果或者异常
        String s = submit.get();
        log.debug("{}", s);
        //DEBUG [pool-1-thread-1] (23:15:20,189) (Test4.java:21) - running....
        //DEBUG [main] (23:15:21,203) (Test4.java:28) - ok
    }
}



2. invokeAll

多个任务一起执行返回List<Future>对象

@Slf4j
public class Test4 {
    public static void main(String[] args) throws ExecutionException, InterruptedException {
        ExecutorService pool = Executors.newFixedThreadPool(2);
        //extracted(pool);

        List<Future<String>> futures = pool.invokeAll(
        //添加三个任务
			Arrays.asList(
                () -> {
                    log.debug("beagin");
                    Thread.sleep(1000);
                    return "1";
                },
                () -> {
                    log.debug("beagin");
                    Thread.sleep(500);
                    return "2";
                },
                () -> {
                    log.debug("beagin");
                    Thread.sleep(2000);
                    return "3";
                }
        ));
        //遍历所有的返回结果,然后打印出来
        futures.forEach(
                f -> {
                    try {
                        log.debug("{}", f.get());
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    } catch (ExecutionException e) {
                        e.printStackTrace();
                    }
                }
        );
        //DEBUG [pool-1-thread-1] (23:29:48,670) (Test4.java:24) - beagin
        //DEBUG [pool-1-thread-2] (23:29:48,670) (Test4.java:29) - beagin
        //DEBUG [pool-1-thread-2] (23:29:49,172) (Test4.java:34) - beagin
        //DEBUG [main] (23:29:51,179) (Test4.java:42) - 1
        //DEBUG [main] (23:29:51,179) (Test4.java:42) - 2
        //DEBUG [main] (23:29:51,180) (Test4.java:42) - 3
    }

}



3. invokeAny

执行所有的任务,谁先执行完成就返回谁的结果,其他的全部取消

@Slf4j
public class Test4 {
    public static void main(String[] args) throws ExecutionException, InterruptedException {
        ExecutorService pool = Executors.newFixedThreadPool(2);
        String s = pool.invokeAny(Arrays.asList(
                () -> {
                    log.debug("beagin");
                    Thread.sleep(1000);
                    return "1";
                },
                () -> {
                    log.debug("beagin");
                    Thread.sleep(500);
                    return "2";
                },
                () -> {
                    log.debug("beagin");
                    Thread.sleep(2000);
                    return "3";
                }
        ));
        log.debug("{}", s);
        //DEBUG [pool-1-thread-1] (23:33:46,263) (Test4.java:22) - beagin
        //DEBUG [pool-1-thread-2] (23:33:46,263) (Test4.java:27) - beagin
        //DEBUG [pool-1-thread-2] (23:33:46,773) (Test4.java:32) - beagin
        //DEBUG [main] (23:33:46,774) (Test4.java:37) - 2
        //只返回了 2 的结果

    }
}



6. 关闭线程池

1. shutdown

/*
线程池状态变为 SHUTDOWN
- 不会接收新任务
- 但已提交任务会执行完
- 此方法不会阻塞调用线程的执行
*/
void shutdown();

public void shutdown() {
      final ReentrantLock mainLock = this.mainLock;
      mainLock.lock();
      try {
          checkShutdownAccess();
          // 修改线程池状态
          advanceRunState(SHUTDOWN);
          // 仅会打断空闲线程
          interruptIdleWorkers();
          onShutdown(); // 扩展点 ScheduledThreadPoolExecutor
      } finally {
          mainLock.unlock();
      }
      // 尝试终结(没有运行的线程可以立刻终结,如果还有运行的线程也不会等)
      tryTerminate();
  }

测试例子:

@Slf4j
public class TestShutDown {

    public static void main(String[] args) throws ExecutionException, InterruptedException {
        ExecutorService pool = Executors.newFixedThreadPool(2);
        log.debug("提交任务1");
        Future<Integer> result1 = pool.submit(() -> {
            log.debug("task 1 running...");
            Thread.sleep(1000);
            log.debug("task 1 finish...");
            return 1;
        });
        log.debug("提交任务2");
        Future<Integer> result2 = pool.submit(() -> {
            log.debug("task 2 running...");
            Thread.sleep(1000);
            log.debug("task 2 finish...");
            return 2;
        });
        log.debug("提交任务3");
        Future<Integer> result3 = pool.submit(() -> {
            log.debug("task 3 running...");
            Thread.sleep(1000);
            log.debug("task 3 finish...");
            return 3;
        });

        log.debug("shutdown");
        pool.shutdown();
    }
}

测试结果:可以看到任务 1、2、3都被提交之后再关闭,那么提交过的任务都会被执行,当然在 shutdown 之后再提交就会抛异常了。注意一点就是 shutdown 不会阻塞主线程的打印。
在这里插入图片描述

//这行代码起到延时的作用,也就是主线程shutdown之后等待线程池多久才继续往下执行
pool.awaitTermination(3, TimeUnit.SECONDS);



`

2. shutdownNow

/*
  线程池状态变为 STOP
- 不会接收新任务
- 会将队列中的任务返回
- 并用 interrupt 的方式中断正在执行的任务
*/
List<Runnable> shutdownNow();

public List<Runnable> shutdownNow() {

       List<Runnable> tasks;
       final ReentrantLock mainLock = this.mainLock;
       mainLock.lock();
       try {
           checkShutdownAccess();
           // 修改线程池状态
           advanceRunState(STOP);
           // 打断所有线程
           interruptWorkers();
           // 获取队列中剩余任务
           tasks = drainQueue();
       } finally {
           mainLock.unlock();
       }
       // 尝试终结
       tryTerminate();
       return tasks;
   }

测试代码:

@Slf4j
public class TestShutDown {

    public static void main(String[] args) throws ExecutionException, InterruptedException {
        ExecutorService pool = Executors.newFixedThreadPool(2);
        log.debug("提交任务1");
        Future<Integer> result1 = pool.submit(() -> {
            log.debug("task 1 running...");
            Thread.sleep(1000);
            log.debug("task 1 finish...");
            return 1;
        });
        log.debug("提交任务2");
        Future<Integer> result2 = pool.submit(() -> {
            log.debug("task 2 running...");
            Thread.sleep(1000);
            log.debug("task 2 finish...");
            return 2;
        });
        log.debug("提交任务3");
        Future<Integer> result3 = pool.submit(() -> {
            log.debug("task 3 running...");
            Thread.sleep(1000);
            log.debug("task 3 finish...");
            return 3;
        });

        log.debug("shutdown");
        //pool.shutdown();
        //pool.awaitTermination(3, TimeUnit.SECONDS);
        List<Runnable> runnables = pool.shutdownNow();
        log.debug("other.... {}" , runnables);
    }
}


执行结果:可以看到由于线程池大小为2,所以,任务1和2可以被线程执行,但是任务3要加入任务队列中阻塞。此时调用 shutdownNow 就会导致任务3不会被执行,而是直接返回,其他正在执行的线程执行完成后返回。所以后面打印出返回的任务 3 了。
在这里插入图片描述



3. 其他方法

// 不在 RUNNING 状态的线程池,此方法就返回 true
boolean isShutdown();

// 线程池状态是否是 TERMINATED
boolean isTerminated();

// 调用 shutdown 后,由于调用线程并不会等待所有任务运行结束,因此如果它想在线程池 TERMINATED 后做些事
//情,可以利用此方法等待,简单来说就是如果想要让调用线程使用了shutdown 之后等待线
//程池执行完成后一段时间才继续向下运行,就可以用这个方法
boolean awaitTermination(long timeout, TimeUnit unit) throws InterruptedException;



7. 异步模式之工作线程

1. 定义

让有限的工作线程(Worker Thread)来轮流异步处理无限多的任务。也可以将其归类为分工模式,它的典型实现就是线程池,也体现了经典设计模式中的享元模式。

例如,海底捞的服务员(线程),轮流处理每位客人的点餐(任务),如果为每位客人都配一名专属的服务员,那 么成本就太高了(对比另一种多线程设计模式:Thread-Per-Message(来一个消息就创建一个新线程处理))

注意,不同任务类型应该使用不同的线程池,这样能够避免饥饿,并能提升效率

例如,如果一个餐馆的工人既要招呼客人(任务类型A),又要到后厨做菜(任务类型B)显然效率不咋地,分成 服务员(线程池A)与厨师(线程池B)更为合理,当然你能想到更细致的分工



2. 饥饿

固定大小线程池会有饥饿现象

  • 两个工人是同一个线程池中的两个线程

  • 他们要做的事情是:为客人点餐和到后厨做菜,这是两个阶段的工作

    • 客人点餐:必须先点完餐,等菜做好,上菜,在此期间处理点餐的工人必须等待
    • 后厨做菜:没啥说的,做就是了
  • 但是现在同时来了两个客人,这时候工人 A 和 工人 B 都去处理点餐了,没人做饭,这时候就出问题了

针对上面的问题,我们可以用不同线程池来处理不同的问题,这样就可以避免了线程过多创建的问题,如果我们只用增加线程的数量,那么当客人达到成百上千的时候线程的数量就太多了,下面我们来测试一下这种现象:

这个程序中,我们定义一个大小为2的线程池,然后我们设计是一个线程处理点餐,一个线程处理做菜,但是现在两个线程都去点餐了:

@Slf4j
public class TestStarvation {
    static final List<String> MENU = Arrays.asList("地三鲜", "宫保鸡丁", "辣子鸡丁", "烤鸡翅");
    static Random RANDOM = new Random();

    static String cooking() {
        return MENU.get(RANDOM.nextInt(MENU.size()));
    }

    public static void main(String[] args) {
        //大小为2的线程
        ExecutorService waiterPool = Executors.newFixedThreadPool(2);
		//一个线程执行点餐
        waiterPool.execute(() -> {
            log.debug("处理点餐...");
            Future<String> f = waiterPool.submit(() -> {
            	//这里也需要一个线程来做菜
                log.debug("做菜");
                return cooking();
            });
            try {
                log.debug("上菜: {}", f.get());
            } catch (InterruptedException | ExecutionException e) {
                e.printStackTrace();
            }
        });

        waiterPool.execute(() -> {
            log.debug("处理点餐...");
            Future<String> f = waiterPool.submit(() -> {
                log.debug("做菜");
                return cooking();
            });
            try {
                log.debug("上菜: {}", f.get());
            } catch (InterruptedException | ExecutionException e) {
                e.printStackTrace();
            }
        });
    }
}

结果截图:
在这里插入图片描述



3. 饥饿解决

针对上面的问题,我们可以采用多个线程池的思路,不同的线程池对应不同的工作职责,这时候点菜和做菜就不会阻塞了。同时多个线程池也使得不必要创建太多的线程数。我们当然可以通过提高线程池的大小来解决问题,但是这样就线程数只会越来越多,造成不必要的麻烦。下面就是解决的方法:

@Slf4j
public class TestStarvation {
    static final List<String> MENU = Arrays.asList("地三鲜", "宫保鸡丁", "辣子鸡丁", "烤鸡翅");
    static Random RANDOM = new Random();

    static String cooking() {
        return MENU.get(RANDOM.nextInt(MENU.size()));
    }

    public static void main(String[] args) {
        //调用2个线程分别做不同的事
        ExecutorService waiterPool = Executors.newFixedThreadPool(1);
        ExecutorService cookPool = Executors.newFixedThreadPool(1);

        waiterPool.execute(() -> {
            log.debug("处理点餐...");
            Future<String> f = cookPool.submit(() -> {
                log.debug("做菜");
                return cooking();
            });
            try {
                log.debug("上菜: {}", f.get());
            } catch (InterruptedException | ExecutionException e) {
                e.printStackTrace();
            }
        });
        waiterPool.execute(() -> {
            log.debug("处理点餐...");
            Future<String> f = cookPool.submit(() -> {
                log.debug("做菜");
                return cooking();
            });
            try {
                log.debug("上菜: {}", f.get());
            } catch (InterruptedException | ExecutionException e) {
                e.printStackTrace();
            }
        });
    }
}


结果输出:
在这里插入图片描述



4. 创建多少线程合适

  • 过小会导致程序不能充分地利用系统资源、容易导致饥饿
  • 过大会导致更多的线程上下文切换,占用更多内存



CPU 密集型运算

通常采用 cpu 核数 + 1 能够实现最优的 CPU 利用率,+1 是保证当线程由于页缺失故障(操作系统)或其它原因导致暂停时,额外的这个线程就能顶上去,保证 CPU 时钟周期不被浪费



I/O 密集型运算

CPU 不总是处于繁忙状态,例如,当你执行业务计算时,这时候会使用 CPU 资源,但当你执行 I/O 操作时、远程RPC 调用时,包括进行数据库操作时,这时候 CPU 就闲下来了,你可以利用多线程提高它的利用率。

经验公式如下:
线程数 = 核数 * 期望 CPU 利用率 * 总时间(CPU计算时间+等待时间) / CPU 计算时间

例如 4 核 CPU 计算时间是 50% ,其它等待时间是 50%,期望 cpu 被 100% 利用,那么调用公式就是:4 * 100% * 100% / 50% = 8

例如 4 核 CPU 计算时间是 10% ,其它等待时间是 90%,期望 cpu 被 100% 利用,那么调用公式就是 4 * 100% * 100% / 10% = 40



8. 任务调度线程池

1. Timer 的缺点(定时任务)

在『任务调度线程池』功能加入之前,可以使用 java.util.Timer 来实现定时功能,Timer 的优点在于简单易用,但由于所有任务都是由同一个线程来调度,因此所有任务都是串行执行的,同一时间只能有一个任务在执行,前一个任务的延迟或异常都将会影响到之后的任务。

@Slf4j
public class TestTimer {
    public static void main(String[] args) {
        Timer timer = new Timer();
        TimerTask task1 = new TimerTask() {
            @Override
            public void run() {
                log.debug("task 1");
                sleep.mySleep(2); //任务1睡眠导致任务2也延迟相应的睡眠时间
                //int i = 1/0;  出异常导致任务2也不执行了
            }
        };
        TimerTask task2 = new TimerTask() {
            @Override
            public void run() {
                log.debug("task 2");
            }
        };

        log.debug("start..........");
        // 使用 timer 添加两个任务,希望它们都在 1s 后执行
       // 但由于 timer 内只有一个线程来顺序执行队列中的任务,因此『任务1』的延时,影响了『任务2』的执行
        timer.schedule(task1, 1000);
        timer.schedule(task2, 1000);
    }
}


输出:

//从 1s后 开始执行
20:46:09.444 c.TestTimer [main] - start... 
//任务1先执行,睡眠2s
20:46:10.447 c.TestTimer [Timer-0] - task 1 
//此时再执行任务2,可以看到和任务1是相隔了2s的
20:46:12.448 c.TestTimer [Timer-0] - task 2



2. 使用 ScheduledExecutorService 改写

ScheduledExecutorService 里面的方法可以使得几个任务同时执行,任务不必一个一个执行,而这个类也有几种用法:


1、 普通使用

  ScheduledExecutorService pool = Executors.newScheduledThreadPool(2);
        pool.schedule(()->{
            log.debug("task 1");
            //sleep.mySleep(2);
            int i = 1/0;
        }, 1, TimeUnit.SECONDS);

        pool.schedule(()->{
            log.debug("task 2");
        }, 1, TimeUnit.SECONDS);
    }
    //DEBUG [pool-1-thread-1] (20:31:54,492) (TestTimer.java:25) - task 1
    //DEBUG [pool-1-thread-2] (20:31:54,492) (TestTimer.java:30) - task 2
    //同时执行,不会因为睡眠或者异常而影响其他任务的执行



2、定时执行 scheduleAtFixedRate
期间的sleep等延时操作会延长定时操作的时间间隔才可以往下执行

 ScheduledExecutorService pool = Executors.newScheduledThreadPool(1);
        log.debug("start....");
        pool.scheduleAtFixedRate(()->{
            log.debug("running");
            //initalDelay:延迟多少秒开始工作
        }, 1, 1, TimeUnit.SECONDS);
        //DEBUG [main] (20:37:55,855) (TestTimer.java:24) - start....
        //DEBUG [pool-1-thread-1] (20:37:56,909) (TestTimer.java:26) - running
        //DEBUG [pool-1-thread-1] (20:37:57,917) (TestTimer.java:26) - running
        //DEBUG [pool-1-thread-1] (20:37:58,910) (TestTimer.java:26) - running
        //DEBUG [pool-1-thread-1] (20:37:59,907) (TestTimer.java:26) - running
        //DEBUG [pool-1-thread-1] (20:38:00,905) (TestTimer.java:26) - running
        //DEBUG [pool-1-thread-1] (20:38:01,904) (TestTimer.java:26) - running



3、延时执行 scheduleWithFixedDelay
scheduleWithFixedDelay中每个任务都要等待上一个任务执行完成之后才可以往下执行,用法:

ScheduledExecutorService pool = Executors.newScheduledThreadPool(1);
	log.debug("start...");
	pool.scheduleWithFixedDelay(()-> {
	 log.debug("running...");
	 sleep(2);
}, 1, 1, TimeUnit.SECONDS);

输出:一开始 1s 后运行,然后由于每个线程都要睡眠2s,所以从第二个线程开始要等待 3s 才可以继续执行

21:40:55.078 c.TestTimer [main] - start... 
21:40:56.140 c.TestTimer [pool-1-thread-1] - running... 
21:40:59.143 c.TestTimer [pool-1-thread-1] - running... 
21:41:02.145 c.TestTimer [pool-1-thread-1] - running... 
21:41:05.147 c.TestTimer [pool-1-thread-1] - running...

最后,总结这个线程池: 整个线程池表现为:线程数固定,任务数多于线程数时,会放入无界队列排队。任务执行完毕,这些线程也不会被释放。用来执行延迟或反复执行的任务



9. 异常处理

1. 方法1:主动捉异常(newScheduledThreadPool例子)

  ScheduledExecutorService pool = Executors.newScheduledThreadPool(1);
	   log.debug("start....");
	    //延时执行
	    pool.scheduleWithFixedDelay(()->{
	        log.debug("running");
	        try{
	        	//异常
	            int i = 1/0;
	        } catch (Exception e){
	        	//我们自己捕捉异常
	            log.debug("{}", e.getMessage());
	        }
	    }, 1, 1, TimeUnit.SECONDS);
	    //下面是输出结果,可以看到异常被打印出来了
	    //DEBUG [main] (20:45:37,593) (TestTimer.java:31) - start....
	    //DEBUG [pool-1-thread-1] (20:45:38,643) (TestTimer.java:34) - running
	    //DEBUG [pool-1-thread-1] (20:45:38,645) (TestTimer.java:38) - / by zero
	    //DEBUG [pool-1-thread-1] (20:45:39,661) (TestTimer.java:34) - running
	    //DEBUG [pool-1-thread-1] (20:45:39,662) (TestTimer.java:38) - / by zero



2. 方法2:使用 Future(newFixedThreadPool例子)

  ExecutorService pool = Executors.newFixedThreadPool(1);
	    Future<Boolean> submit = pool.submit(() -> {
	          log.debug("running....");
	          int i = 1 / 0;
	          return true;
	      });
	      //出异常了就会封装到ExecutorService对象中,调用get()方法就可以获取到了
	      log.debug("{}", submit.get());

		

结果输出:下面是捕获到的异常

21:54:58.208 c.TestTimer [pool-1-thread-1] - task1 
Exception in thread "main" java.util.concurrent.ExecutionException: 
java.lang.ArithmeticException: / by zero 
	at java.util.concurrent.FutureTask.report(FutureTask.java:122) 
	at java.util.concurrent.FutureTask.get(FutureTask.java:192) 
	at cn.itcast.n8.TestTimer.main(TestTimer.java:31) 
Caused by: java.lang.ArithmeticException: / by zero 
	 at cn.itcast.n8.TestTimer.lambda$main$0(TestTimer.java:28) 
	 at java.util.concurrent.FutureTask.run(FutureTask.java:266) 
	 at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) 
	 at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) 
	 at java.lang.Thread.run(Thread.java:748)

总结以下:建议自己捕获异常,可以自己在里面做一些自定义的处理



10. 定时任务

在 springboot 中可以使用 @Scheduled 这个注解来配置定时任务

@Slf4j
public class TestScheduled {
    //在周四18:00:00定时执行任务
    public static void main(String[] args) {
        //获取当前时间
        LocalDateTime now = LocalDateTime.now();
        LocalDateTime time = now.withHour(18).withMinute(0).withSecond(0).withNano(0).with(DayOfWeek.THURSDAY);
        //一周时间
        long period = 1000 * 60 * 60 *  24 * 7;
        //判断如果当前时间大于本周周四,就推迟到下周执行
        if(now.compareTo(time) > 0){
            time = time.plusWeeks(1L);
        }
        //计算两个LocalDateTime时间的差值
        long initDelayTime = Duration.between(now, time).toMillis();
        //scheduleAtFixedRate(task,time,period)
        //task-所要安排的任务 time-首次执行任务的时间 period-执行一次task的时间间隔,单位毫秒
        ScheduledExecutorService pool = Executors.newScheduledThreadPool(1);
        pool.scheduleAtFixedRate(()->{
            log.debug("running....");
        }, initDelayTime, period, TimeUnit.SECONDS);
    }
}



11. tomcat线程池

下面来看看 tomcat 在哪用到了线程池
在这里插入图片描述

  • LimitLatch 用来限流,可以控制最大连接个数,类似 J.U.C 中的 Semaphore 后面再讲
  • Acceptor 只负责【接收新的 socket 连接】
  • Poller 只负责监听 socket channel 是否有【可读的 I/O 事件】
  • 一旦可读,封装一个任务对象(socketProcessor),提交给 Executor 线程池处理
  • Executor 线程池中的工作线程最终负责【处理请求】



Tomcat 线程池扩展了 ThreadPoolExecutor,行为稍有不同

  • 如果总线程数达到 maximumPoolSize(最大线程数)

    • 这时不会立刻抛 RejectedExecutionException 异常,而是再次尝试将任务放入队列
    • 如果还失败,才抛出 RejectedExecutionException 异常

源码 tomcat-7.0.42

 public void execute(Runnable command, long timeout, TimeUnit unit) {
        submittedCount.incrementAndGet();
        try {
            super.execute(command);
        } catch (RejectedExecutionException rx) {
            if (super.getQueue() instanceof TaskQueue) {
                final TaskQueue queue = (TaskQueue)super.getQueue();
                try {
                    // 使任务从新进入阻塞队列
                    if (!queue.force(command, timeout, unit)) {
                        //如果还是失败才会抛出异常
                        submittedCount.decrementAndGet();
                        throw new RejectedExecutionException("Queue capacity is full.");
                    }
                } catch (InterruptedException x) {
                    submittedCount.decrementAndGet();
                    Thread.interrupted();
                    throw new RejectedExecutionException(x);
                }
            } else {
                submittedCount.decrementAndGet();
                throw rx;
            }
        }
    }

TaskQueue.java

public boolean force(Runnable o, long timeout, TimeUnit unit) throws InterruptedException {
    if ( parent.isShutdown() )
        throw new RejectedExecutionException(
        "Executor not running, can't force a command into the queue"
    );
    return super.offer(o,timeout,unit); //forces the item onto the queue, to be used if the task  is rejected
   
}



连接Connector 配置:
在这里插入图片描述


Executor 线程配置:
在这里插入图片描述
在这里插入图片描述



2. Fork/Join

1. 概念

Fork/Join 是 JDK 1.7 加入的新的线程池实现,它体现的是一种分治思想,适用于能够进行任务拆分的 cpu 密集型运算

所谓的任务拆分,是将一个大任务拆分为算法上相同的小任务,直至不能拆分可以直接求解。跟递归相关的一些计算,如归并排序、斐波那契数列、都可以用分治思想进行求解

Fork/Join 在分治的基础上加入了多线程,可以把每个任务的分解和合并交给不同的线程来完成,进一步提升了运算效率

Fork/Join 默认会创建与 cpu 核心数大小相同的线程池


2. 使用

提交给 Fork/Join 线程池的任务需要继承 RecursiveTask(有返回值)或 RecursiveAction(没有返回值),例如下面定义了一个对 1~n 之间的整数求和的任务:使用递归 + 多线程的方式,每一步交给线程池去执行

public class TestForkJoin {
    public static void main(String[] args) {
        ForkJoinPool pool = new ForkJoinPool(4);
        System.out.println(pool.invoke(new MyTask(5)));
        //任务拆分:MyTask(5) = 5 + MyTask(4) = 5 + 4 + MyTask(3) = ...
        //其实就是递归 + 多线程
        //15
    }
}

//如果是继承的RecursiveAction就是没有返回结果
//进行计算1-n之间的数字的和
class MyTask extends RecursiveTask<Integer> {

    private int n;

    public MyTask(int n){
        this.n = n;
    }

    @Override
    protected Integer compute() {
        //终止条件
        if(n == 1){
            return 1;
        }
        MyTask t1 = new MyTask(n - 1);
        //让一个线程去执行这个任务
        t1.fork();
        //获取t1的结果,如果初始构造是MyTask(5),那么第一次调用result =5 + MyTask(4)
        int result = t1.join() + n;
        return result;
    }
}

带过程的代码:

public class TestForkJoin2 {

    public static void main(String[] args) {
        ForkJoinPool pool = new ForkJoinPool(4);
        System.out.println(pool.invoke(new MyTask(5)));
    }
}

// 1~n 之间整数的和
@Slf4j
class MyTask extends RecursiveTask<Integer> {

    private int n;

    public MyTask(int n) {
        this.n = n;
    }

    @Override
    public String toString() {
        return "{" + n + '}';
    }

    @Override
    protected Integer compute() {
        // 如果 n 已经为 1,可以求得结果了
        if (n == 1) {
            log.debug("join() {}", n);
            return n;
        }

        // 将任务进行拆分(fork)
        AddTask1 t1 = new AddTask1(n - 1);
        t1.fork();
        log.debug("fork() {} + {}", n, t1);

        // 合并(join)结果
        int result = n + t1.join();
        log.debug("join() {} + {} = {}", n, t1, result);
        return result;
    }
}

输出结果:

	//下面四个线程一个线程执行一步操作
   DEBUG [ForkJoinPool-1-worker-1] (22:04:05,767) (TestForkJoin2.java:51) - fork() 5 + {4}
   DEBUG [ForkJoinPool-1-worker-2] (22:04:05,767) (TestForkJoin.java:48) - fork() 4 + {3}
    DEBUG [ForkJoinPool-1-worker-3] (22:04:05,767) (TestForkJoin.java:48) - fork() 3 + {2}
    DEBUG [ForkJoinPool-1-worker-0] (22:04:05,767) (TestForkJoin.java:48) - fork() 2 + {1}
	
	//线程3获取最下面的1
    DEBUG [ForkJoinPool-1-worker-3] (22:04:05,773) (TestForkJoin.java:42) - join() 1
    //线程0获取最下面的1交给线程0进行加法,依次类推
    DEBUG [ForkJoinPool-1-worker-0] (22:04:05,773) (TestForkJoin.java:50) - join() 2 + {1} = 3
    DEBUG [ForkJoinPool-1-worker-3] (22:04:05,773) (TestForkJoin.java:50) - join() 3 + {2} = 6
    DEBUG [ForkJoinPool-1-worker-2] (22:04:05,773) (TestForkJoin.java:50) - join() 4 + {3} = 10
    DEBUG [ForkJoinPool-1-worker-1] (22:04:05,773) (TestForkJoin2.java:55) - join() 5 + {4} = 15
    //15new MyTask(5)  5+ new MyTask(4)  4 + new MyTask(3)  3 + new MyTask(2)  2 + new MyTask(1)

在这里插入图片描述



3. 优化

当然,对于上面的代码我们还可以进一步优化,上面的方法任务都是相互依赖的,一个任务结果没有返回那么下一个任务是无法执行的,现在使用新的方法:使用二分配合多线程

@Slf4j
class AddTask3 extends RecursiveTask<Integer> {

    int begin;
    int end;
	
    public AddTask3(int begin, int end) {
        this.begin = begin;
        this.end = end;
    }

    @Override
    public String toString() {
        return "{" + begin + "," + end + '}';
    }

    @Override
    protected Integer compute() {
    	//当begin 和 end 相同的时候直接返回就行了
        if (begin == end) {
            log.debug("join() {}", begin);
            return begin;
        }
        //如果是相邻的也没必要拆分了,因为此时求出来的中间值都是不变的
        //比如4和5,那么两个区间就是[4,4] 和 [5,5],这时候相加就是4+5
        if (end - begin == 1) {
            log.debug("join() {} + {} = {}", begin, end, end + begin);
            return end + begin;
        }
        //求出中间值
        int mid = (end + begin) / 2;
		//这里负责求 begin-mid
        AddTask3 t1 = new AddTask3(begin, mid);
        t1.fork();
        //这里负责求 mid+1 - end
        AddTask3 t2 = new AddTask3(mid + 1, end);
        t2.fork();
        log.debug("fork() {} + {} = ?", t1, t2);

        int result = t1.join() + t2.join();
        log.debug("join() {} + {} = {}", t1, t2, result);
        return result;
    }
}

输出结果:

DEBUG [ForkJoinPool-1-worker-0] (22:14:59,628) (TestForkJoin.java:118) - join() 1 + 2 = 3
DEBUG [ForkJoinPool-1-worker-3] (22:14:59,628) (TestForkJoin.java:118) - join() 4 + 5 = 9
DEBUG [ForkJoinPool-1-worker-2] (22:14:59,628) (TestForkJoin.java:127) - fork() {1,2} + {3,3} = ?
DEBUG [ForkJoinPool-1-worker-1] (22:14:59,628) (TestForkJoin.java:127) - fork() {1,3} + {4,5} = ?
DEBUG [ForkJoinPool-1-worker-0] (22:14:59,630) (TestForkJoin.java:114) - join() 3
DEBUG [ForkJoinPool-1-worker-2] (22:14:59,633) (TestForkJoin.java:130) - join() {1,2} + {3,3} = 6
DEBUG [ForkJoinPool-1-worker-1] (22:14:59,633) (TestForkJoin.java:130) - join() {1,3} + {4,5} = 15
15

在这里插入图片描述



4. 文件拆分

如果一个大文件就可以拆分成不同GB级别的文件流给不同线程处理,会更快。Stream并行流。





如有错误,欢迎指出!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值