线程池的原理

为什么使用线程池

Java中的线程池运用最多的场景是解决并发的问题,几乎所有的异步或并发任务都使用到线程池。那线程池能给我们到来那些好处呢?

第一:降低资源损耗,通过复用已经创建的线程降低线程的创建和销毁造成的损耗。

第二:提高响应速度,当任务到达时,任务可以不需要等到线程创建就能立即执行,假如一个服务器完成一个任务的时间为:T1线程创建时间,T2任务执行时间,T3销毁线程时间。如果:T1+T3远大于T2,则可以使用线程池,以提高服务器的性能。

第三:提高线程的可管理性。线程是稀缺资源,如果无限制的创建,不仅会销毁系统资源,还会降低系统的稳定性。使用线程池可以进行统一的分配、调用和监控。

ThreadPoolExecutor的类关系

ThreadPollExecutor是线程池的具体实现类,在具体学习线程池之前,我们首先了解一下ThreadPollExecutor类的继承结构。

Executor是一个接口,它是Executor框架的基础,它将任务的提交和任务的执行分离出来。

ExecutorService接口继承了Executor,在其上做了一下shutdown()、submit()的拓展,可以说是真正的线程池接口。

AbstractExecutorService抽象类实现了ExecutorService接口中的大部分的方法。

ThreadPoolExecutor是线程池的核心实现类,用来执行被提交的任务。

ScheduledExecutorService接口继承了ExecutorService接口,提供了带“周期性执行”功能的ExecutorService。

ScheduledThreadPoolExecutor是一个实现类,可以在给定的延迟后运行命令,或者定时执行命令。ScheduledThreadPoolExecutor比Timer更灵活,功能更强大。

分析ThreadPollExecutor的构造参数

想了解一个类,当然要从它的源码入手,当然这个过程是一个快乐并痛苦的过程。今天我们就从ThreadPollExecutor的构造参数撸起:

    public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) {
        if (corePoolSize < 0 ||
            maximumPoolSize <= 0 ||
            maximumPoolSize < corePoolSize ||
            keepAliveTime < 0)
            throw new IllegalArgumentException();
        if (workQueue == null || threadFactory == null || handler == null)
            throw new NullPointerException();
        this.corePoolSize = corePoolSize;
        this.maximumPoolSize = maximumPoolSize;
        this.workQueue = workQueue;
        this.keepAliveTime = unit.toNanos(keepAliveTime);
        this.threadFactory = threadFactory;
        this.handler = handler;
    }

通过源码发现,发现ThreadPoolExecutor有7个参数:

corePoolSize:线程池中的核心线程数,当提交一个任务时,线程池创建一个新的线程执行任务,直到当前的线程数为corePoolSize;如果当前线程数为corePoolSize,继续提交的任务被保存在阻塞队列中,等待被执行;如果执行了线程池的prestartAllCoreThreads()方法,线程池会提前创建并启动所有的核心线程。

maximumPoolSize:线程池中允许的最大线程数,如果当前阻塞队列满了,且继续提价任务,则创建新的线程执行任务,但当前已经创建的总线程数必须小于maximumPoolSize。

keepAliveTime:线程空闲时的存活时间,即当前线程没有任务执行时,继续存活时间,默认情况下,该参数只在线程大于corePoolSize的时候有效。

unit:keepAliveTime的时间单位

workQueue:线程池的阻塞队列,当线程池中线程数大于corePoolSize的时候,线程会进入阻塞队列进行阻塞等待,通过workQueue线程池实现了阻塞功能。

一般来说,我们应该尽量使用有界队列,如果使用无界队列作为工作队列会对线程池造成以下影响:第一、当当前线程到达了corePoolSize之后,新任务会进入无界阻塞队列进行等待,因此线程池中的线程永远不会超过corePoolSize;第二、由于原因1,使用无界队列会使maximumPoolSize无效。第三、由于原因1和原因2会使keepAliveTime存活时间无效。第四、使用无界队列可能耗尽系统资源,有界队列则有助于防止资源耗尽,同时即使使用有界队列,也要尽量的控制队列大小在一个合适的范围。

threadFactory:创建线程的工厂,通过自定义的线程工厂可以给每个新建的线程设置一个具有识别度的线程名,当然还可以更加自由的对线程做更多的设置,比如设置所有的线程为守护线程

handler:线程池的饱和策略,当线程池中的当前线程达到了maximumPoolSize,如果继续提交任务,必须采取一种策略处理该任务,线程池提供了4种策略:

  1. AbortPolicy:直接抛出异常,默认策略
  2. CallerRunsPolicy:用调用者所在的线程来执行任务,即谁产生谁消费。
  3. DiscardOldestPolicy:丢弃阻塞队列中靠最前的任务,并执行当前任务。
  4. DiscardPolicy:直接丢弃任务;

当然也可以根据应用场景实现RejectedExecutionHandler接口,自定义饱和策略,如记录日志或持久化存储不能处理的任务。

线程池的工作机制

  1. 如果当前线程数小于corePoolSize,则创建新线程来执行任务(注意,执行这一步骤需要获取全局锁)
  2. 如果当前线程数大于或者等于corePoolSize,则将任务加入BlockingQueue阻塞队列中。
  3. 如果BlockingQueue队列已经满了,则创建新的线程来处理任务。
  4. 如果创建新线程是当前线程运行线程大于maximumPoolSize,任务将被拒接,并调用RejectedExecutionHandler.rejectedExecution()方法。

提交任务方式

线程池中提交任务有两种方式:

  1. execute()方法用于提交不需要返回值的任务,无法判断任务是否被线程池执行成功。
  2. submit()方法用于提交需要返回值的任务,线程池会返回一个future类型的对象,通过future对象可以判断任务是否被执行成功,并且通过future的get()方法来获取返回值,get()方法会阻塞当前线程直到任务执行完成,而使用get(long timeout,TimeUnit unit)方法则会阻塞当前线程一段时间后立即返回,这时候有可能任务没有执行完。

关闭线程池

可以调用shutdown和shutdownNow方法来关闭线程。它们的原理是遍历线程池中的工作线程,然后逐个调用线程的interrupt方法来中断线程,所以无法响应的中断任务可能永远无法停止。但是他们存在一定的区别,shutdownNow首先将线程池的状态设置为STOP状态,然后尝试停止所有正在执行或暂停任务的线程,并返回等待执行任务的列表;而shutdown只是将线程池状态设置为SHUTDOWN状态,然后中断所有没有正在执行任务的线程。

只要调用了这两个方法中的任意一个,isShutdown方法就会返回true,当所有的任务都已关闭后,才表示线程池关闭成功,这是调用isTerminaed方法会返回true,至于应该调用哪一种方法来关闭线程池,应该由提交到线程池的任务特性决定,通常调用shutdown方法来关闭线程池,如果任务不一定要执行完,则可以调用shutdownNow方法。

配置线程池参数

如何合理的配置线程池的参数,就必须从任务的特性进行分析,主要从任务的性质、任务的优先级和任务的执行时间进行配置。

  • 任务性质:CPU密集型、IO密集型任务和混合型任务
  • 任务优先级:高、中和低
  • 任务执行时间:长、中和短

CPU密集型的任务应配置尽可能小的线程,通常配置Ncpu + 1个的线程池(Ncpu + 1都是指的是maximumPoolSize,以下同理)。由于IO密集型任务CPU并不是一直执行任务,所以尽可能的配置多的线程,通常设置2*Ncpu个线程池。混合型任务的话,如果可以拆分的话,将其拆分一个CPU密集型和一个IO密集型任务,只要这两个任务执行的时间相差不是太大,那么分解后执行的吞吐量将高于串行执行的吞吐量。如果这两个任务执行时间相差太大,则没必要进行分解。

通过Runtime.getRuntime().availableProcessors()方法获得当前设备的CPU个数,即上面的Ncpu。

优先级不同的任务可以使用优先级队列PriorityBlockingQueue来处理。它可以让优先级高的任务先执行。

执行时间不同的任务可以交给不同规模的线程池来处理,或者可以使用优先级队列,让执行时间短的任务先执行。

以上就是线程池的核心知识点,如果发现其中的错误,欢迎大家踊跃指出。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值