Java 线程池如何实现及拆分详解

本文详细介绍了Java线程池ThreadPoolExecutor的原理、参数配置及其影响,包括corePoolSize、maximumPoolSize、keepAliveTime等。线程池通过减少线程创建销毁的开销、提高响应速度和管理线程来提升系统性能。合理配置线程池要考虑任务性质、优先级、执行时间和依赖性等因素。此外,文章还探讨了线程池的关闭策略和如何自定义饱和策略。
摘要由CSDN通过智能技术生成

为什么要用线程池

  Java中的线程池是运用场景最多的并发框架,几乎所有需要异步或并发执行任务的程序都可以使用线程池。在开发过程中,合理地使用线程池能够带来3个好处。

  1. 降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
  2. 提高响应速度。当任务到达时,任务可以不需要等到线程创建就能立即执行。假设一个服务器完成一项任务所需时间为:T1 创建线程时间,T2 在线程中执行任务的时间,T3 销毁线程时间。 如果:T1 + T3 远大于 T2,则可以采用线程池,以提高服务器性能。线程池技术正是关注如何缩短或调整T1,T3时间的技术,从而提高服务器程序性能的。它把T1,T3分别安排在服务器程序的启动和结束的时间段或者一些空闲的时间段,这样在服务器程序处理客户请求时,不会有T1,T3的开销了,缩短任务的总时间
  3. 提高线程的可管理性。线程是稀缺资源,如果无限制地创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一分配、调优和监控管理起来

ThreadPoolExecutor 的类关系

  Executor 是一个接口,它是 Executor 框架的基础,它将任务的提交与任务的执行分离开来。
  ExecutorService 接口继承了Executor ,在其上做了一些 shutdown()submit() 的扩展,可以说是真正的线程池接口;
  AbstractExecutorService 抽象类实现了 ExecutorService 接口中的大部分方法;
  ThreadPoolExecutor 是线程池的核心实现类,用来执行被提交的任务。
  ScheduledExecutorService 接口继承了 ExecutorService 接口,提供了带"周期执行"功能 ExecutorService
  ScheduledThreadPoolExecutor 是一个实现类,可以在给定的延迟后运行命令,或者定期执行命令,ScheduledThreadPoolExecutorTimer 更灵活,功能更强大


搞懂线程池的各个参数的含义和对工作机制的影响

线程池的创建各个参数含义

源代码:

public ThreadPoolExecutor( int corePoolSize,
						   int maximumPoolSize,
						   long keepAliveTime,
						   TimeUnit unit,
						   BlockingQueue<Runnable> workQueue,
						   ThreadFactory threadFactory,
						   RejectedExecutionHandler handler){}

1. corePoolSize

  线程池中的核心线程数,当提交一个任务时,线程池创建一个新线程执行任务,直到当前线程数等于corePoolSize
  如果当前线程数为corePoolSize,继续提交的任务被保存到阻塞队列中,等待被执行;
  如果执行了线程池的prestartAllCoreThreads() 方法,线程池会提前创建并启动所有核心线程

2. maximumPoolSize

  线程池中允许的最大线程数。如果当前阻塞队列满了,且继续提交任务,则创建新的线程执行任务,前提是当前线程数小于maximumPoolSize

3. keepAliveTime

  线程空闲时的存活时间,即当线程没有任务执行时,继续存活的时间。默认情况下,该参数只在线程数大于 corePoolSize 时才有用

4. TimeUnit

  keepAliveTime 的时间单位

5. workQueue

  workQueue 必须是BlockingQueue 阻塞队列。当线程池中的线程数超过它的corePoolSize 的时候,线程会进入阻塞队列进行阻塞等待。通过workQueue,线程池实现了阻塞功能。
一般来说,我们应该尽量使用有界队列,因为使用无界队列作为工作队列会对线程池带来如下影响。

  1. 当线程池中的线程数达到corePoolSize 后,新任务将在无界队列中等待,因此线程池中的线程数不会超过corePoolSize
  2. 由于1,使用无界队列时maximumPoolSize 将是一个无效参数。
  3. 由于1和2,使用无界队列时keepAliveTime 将是一个无效参数。
  4. 更重要的,使用无界queue 可能会耗尽系统资源,有界队列则有助于防止资源耗尽,同时即使使用有界队列,也要尽量控制队列的大小在一个合适的范围。

6. threadFactory

  创建线程的工厂,通过自定义的线程工厂可以给每个新建的线程设置一个具有识别度的线程名,当然还可以更加自由的对线程做更多的设置,比如设置所有的线程为守护线程。
  Executors 静态工厂里默认的threadFactory,线程的命名规则是“pool-数字-thread-数字”

7. RejectedExecutionHandler

  线程池的饱和策略,当阻塞队列满了,且没有空闲的工作线程,如果继续提交任务,必须采取一种策略处理该任务,线程池提供了4种策略:

  1. AbortPolicy:直接抛出异常,系统默认策略;
    public static class AbortPolicy implements RejectedExecutionHandler {
        /**
         * Creates an {@code AbortPolicy}.
         */
        public AbortPolicy() { }

        /**
         * Always throws RejectedExecutionException.
         *
         * @param r the runnable task requested to be executed
         * @param e the executor attempting to execute this task
         * @throws RejectedExecutionException always
         */
        public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
            throw new RejectedExecutionException("Task " + r.toString() +
                                                 " rejected from " +
                                                 e.toString());
        }
    }
  1. CallerRunsPolicy:用调用者所在的线程来执行任务,谁提交任务就让谁自己取执行该任务
    public static class CallerRunsPolicy implements RejectedExecutionHandler {
        /**
         * Creates a {@code CallerRunsPolicy}.
         */
        public CallerRunsPolicy() { }

        /**
         * Executes task r in the caller's thread, unless the executor
         * has been shut down, in which case the task is discarded.
         *
         * @param r the runnable task requested to be executed
         * @param e the executor attempting to execute this task
         */
        public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
            if (!e.isShutdown()) {
                r.run();
            }
        }
    }
  1. DiscardOldestPolicy:直接丢弃阻塞队列中靠最前的任务,并执行当前任务;
    public static class DiscardOldestPolicy implements RejectedExecutionHandler {
        /**
         * Creates a {@code DiscardOldestPolicy} for the given executor.
         */
        public DiscardOldestPolicy() { }

        /**
         * Obtains and ignores the next task that the executor
         * would otherwise execute, if one is immediately available,
         * and then retries execution of task r, unless the executor
         * is shut down, in which case task r is instead discarded.
         *
         * @param r the runnable task requested to be executed
         * @param e the executor attempting to execute this task
         */
        public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
            if (!e.isShutdown()) {
                e.getQueue().poll();
                e.execute(r);
            }
        }
    }
  1. DiscardPolicy:直接丢弃任务,当作没看见 ;
    public static class DiscardPolicy implements RejectedExecutionHandler {
        /**
         * Creates a {@code DiscardPolicy}.
         */
        public DiscardPolicy() { }

        /**
         * Does nothing, which has the effect of discarding task r.
         *
         * @param r the runnable task requested to be executed
         * @param e the executor attempting to execute this task
         */
        public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        }
    }

  当然也可以根据应用场景实现RejectedExecutionHandler 接口,自定义饱和策略,如记录日志或持久化存储不能处理的任务,即自己实现拒绝策略接口,然后当作参数交给创建的线程池


线程池的工作机制

在这里插入图片描述

  1. 如果当前运行的线程少于corePoolSize,则创建新线程来执行任务(注意,执行这一步骤需要获取全局锁)。
  2. 如果运行的线程等于或多于corePoolSize,则将任务加入BlockingQueue
  3. 如果无法将任务加入BlockingQueue(队列已满),则创建新的线程来处理任务。
  4. 如果创建新线程将使当前运行的线程超出maximumPoolSize,任务将被拒绝,并调用RejectedExecutionHandler.rejectedExecution() 方法

提交任务

  execute() 用于提交不需要返回值的任务,所以无法判断任务是否被线程池执行成功。
  submit() 返回值的任务。线程池会返回一个 future 类型的对象,通过这个 future 对象可以判断任务是否执行成功,并且可以通过 futureget() 方法来获取返回值,get() 方法会阻塞当前线程直到任务完成,而使用 get(long timeout,TimeUnit unit) 方法则会阻塞当前线程一段时间后立即返回,这时候有可能任务没有执行完


关闭线程池

  可以通过调用线程池的 shutdownshutdownNow 方法来关闭线程池。它们的原理是遍历线程池中的工作线程,然后逐个调用线程的 interrupt 方法来中断线程,所以无法响应中断的任务可能永远无法终止。但是它们存在一定的区别,shutdownNow 首先将线程池的状态设置成 STOP ,然后尝试停止所有的正在执行或暂停任务的线程,并返回等待执行任务的列表,而shutdown只是将线程池的状态设置成 SHUTDOWN 状态,然后中断所有没有正在执行任务的线程 。
  只要调用了这两个关闭方法中的任意一个,isShutdown 方法就会返回 true。当所有的任务都已关闭后,才表示线程池关闭成功,这时调用 isTerminaed 方法会返回 true。至于应该调用哪一种方法来关闭线程池,应该由提交到线程池的任务特性决定,通常调用 shutdown 方法来关闭线程池,如果任务不一定要执行完,则可以调用 shutdownNow 方法。
  shutdownNow 也未必能关闭正在执行的线程,因为线程的中断是一种协作机制的,能不能中断要看看任务怎么处理中断信号,shutdownNow 只是发出中断信号,即调用 interrupt 方法,能不能真正关闭要看自己写的任务有没有去处理中断信号


合理地配置线程池

  要想合理地配置线程池,就必须首先分析任务特性,可以从以下几个角度来分析。

  • 任务的性质:CPU 密集型任务、IO 密集型任务和混合型任务。
  • 任务的优先级:高、中和低。
  • 任务的执行时间:长、中和短。
  • 任务的依赖性:是否依赖其他系统资源,如数据库连接。
      性质不同的任务可以用不同规模的线程池分开处理。
      
       CPU 密集型任务应配置尽可能小的线程,如配置 Ncpu+1 个线程的线程池(最多加一,线程数:机器的 CPU 核心数+1,线程数是最大线程数不是核心线程数!)。由于IO密集型任务线程并不是一直在执行任务,则应配置尽可能多的线程,如 2*Ncpu
      混合型的任务,如果可以拆分,将其拆分成一个CPU密集型任务和一个IO密集型任务,只要这两个任务执行的时间相差不是太大,那么分解后执行的吞吐量将高于串行执行的吞吐量。如果这两个任务执行时间相差太大,则没必要进行分解。可以通过Runtime.getRuntime().availableProcessors() 方法获得当前设备的CPU 核心个数。
      优先级不同的任务可以使用优先级队列PriorityBlockingQueue来处理。它可以让优先级高的任务先执行。
      执行时间不同的任务可以交给不同规模的线程池来处理,或者可以使用优先级队列,让执行时间短的任务先执行。
      建议使用有界队列。有界队列能增加系统的稳定性和预警能力,可以根据需要设大一点儿,比如几千。
      如果当时我们设置成无界队列,那么线程池的队列就会越来越多,有可能会撑满内存,导致整个系统不可用,而不只是后台任务出现问题
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值