并发编程之线程池

骑上不归路 i

已于 2023-03-09 17:12:51 修改

阅读量325

点赞数 1

分类专栏：多线程并发编程文章标签：测试工程师 java 开发语言

于 2021-11-26 15:36:26 首次发布

本文链接：https://blog.csdn.net/weixin_45476233/article/details/121559228

版权

多线程并发编程专栏收录该内容

8 篇文章 0 订阅

订阅专栏

程序的运行，其本质上，是对系统资源(CPU、内存、磁盘、网络等等)的使用。如何高效的使用这些资源是我们编程优化演进的一个方向。今天说的线程池就是一种对CPU利用的优化手段。
通过学习线程池原理，明白所有池化技术的基本设计思路。遇到其他相似问题可以解决。

池化技术

前面提到一个名词——池化技术，那么到底什么是池化技术呢 ?
池化技术简单点来说，就是提前保存大量的资源，以备不时之需。在机器资源有限的情况下，使用池化技术可以大大的提高资源的利用率，提升性能等。在编程领域，比较典型的池化技术有：线程池、连接池、内存池、对象池等。
主要来介绍一下其中比较简单的线程池的实现原理，希望读者们可以举一反三，通过对线程池的理解，学习并掌握所有编程中池化技术的底层原理。

我们通过创建一个线程对象，并且实现Runnable接口就可以实现一个简单的线程。可以利用上多核CPU。当一个任务结束，当前线程就接收。

但很多时候，我们不止会执行一个任务。如果每次都是如此的创建线程->执行任务->销毁线程，会造成很大的性能开销。

那能否一个线程创建后，执行完一个任务后，又去执行另一个任务，而不是销毁。这就是线程池。这也就是池化技术的思想，通过预先创建好多个线程，放在池中，这样可以在需要使用线程的时候直接获取，避免多次重复创建、销毁带来的开销。

线程池的优势

线程池做的工作主要是：控制运行的线程数量，处理过程中将任务放入队列，然后在线程创建后启动这些任务，如果线程数量超过了最大数量，超出数量的线程排队等候，等其他线程执行完毕，再从队列中取出任务来执行。
它的主要特点为：线程复用，控制最大并发数，管理线程。
第一：降低资源消耗，通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
第二：提高响应速度。当任务到达时，任务可以不需要等待线程创建就能立即执行。
第三：提高线程的可管理性，线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一分配，调优和监控。

三大方法说明

Executors.newFixedThreadPool(int)
执行长期任务性能好，创建一个线程池，一池有N个固定的线程，有固定线程数的线程。

public class MyThreadPoolDemo { 
	public static void main(String[] args) { 
		// 池子大小 5 ExecutorService threadPool = Executors.newFixedThreadPool(5); 
		try {
			// 模拟有10个顾客过来银行办理业务，池子中只有5个工作人员受理业务 
			for (int i = 1; i <= 10; i++) { 
				threadPool.execute(()->{ 				
				System.out.println(Thread.currentThread().getName()+" 办理业务"); 
				});
			}
		} catch (Exception e) { 
			e.printStackTrace(); 
		} finally { 
			threadPool.shutdown(); 
			// 用完记得关闭
		}
	}
}

Executors.newSingleThreadExecutor()
只有一个线程

public class MyThreadPoolDemo { 
	public static void main(String[] args) { 
		// 有且只有一个固定的线程
		ExecutorService threadPool = Executors.newSingleThreadExecutor(); 
		try {
		// 模拟有10个顾客过来银行办理业务，池子中只有1个工作人员受理业务 
			for (int i = 1; i <= 10; i++) { 
				threadPool.execute(()->	{
				System.out.println(Thread.currentThread().getName()+" 办理业务"); 
				}); 
			}
		} catch (Exception e) {
			e.printStackTrace(); 
		} finally { 
			threadPool.shutdown(); 
			// 用完记得关闭 
		}
	}
}

Executors.newCachedThreadPool();
执行很多短期异步任务，线程池根据需要创建新线程，但在先构建的线程可用时将重用他们。
可扩容，遇强则强

public class MyThreadPoolDemo { 
	public static void main(String[] args) { 
		// 一池N线程，可扩容伸缩 
		ExecutorService threadPool = Executors.newCachedThreadPool(); 
		try {
			// 模拟有10个顾客过来银行办理业务，池子中只有N个工作人员受理业务 
			for (int i = 1; i <= 10; i++) { 
			// 模拟延时看效果 
			// try { 
			// TimeUnit.SECONDS.sleep(1); 
			// } catch (InterruptedException e) {
			// e.printStackTrace();
			// } 
			threadPool.execute(()->{ 			
				System.out.println(Thread.currentThread().getName()+" 办理业务"); 
			}); 
		} } catch (Exception e) { 
			e.printStackTrace(); 
		} finally { 
			threadPool.shutdown(); 
			// 用完记得关闭 
		}
	}
} 1234567891011121314151617181920212223242526

ThreadPoolExecutor 七大参数

操作：查看三大方法的底层源码，发现本质都是调用了 new ThreadPoolExecutor ( 7 大参数 )

参数理解：

corePollSize
核心线程数。在创建了线程池后，线程中没有任何线程，等到有任务到来时才创建线程去执行任务。默认情况下，在创建了线程池后，线程池中的线程数为0，当有任务来之后，就会创建一个线程去执行任务，当线程池中的线程数目达到corePoolSize后，就会把到达的任务放到缓存队列当中。
maximumPoolSize
最大线程数。表明线程中最多能够创建的线程数量，此值必须大于等于1。
keepAliveTime
空闲的线程保留的时间。
TimeUnit
空闲线程的保留时间单位。
BlockingQueue< Runnable>
阻塞队列，存储等待执行的任务。参数有ArrayBlockingQueue、LinkedBlockingQueue、SynchronousQueue可选。
ThreadFactory
线程工厂，用来创建线程，一般默认即可
RejectedExecutionHandler
队列已满，而且任务量大于最大线程的异常处理拒绝策略。

线程池的拒绝策略

RejectedExecutionHandler rejected = null; 
rejected = new ThreadPoolExecutor.AbortPolicy();//默认，队列满了丢弃任务，抛出异常 
rejected = new ThreadPoolExecutor.DiscardPolicy();//队列满了丢任务，不抛出异常【如 果允许任务丢失这是最好的】 
rejected = new ThreadPoolExecutor.DiscardOldestPolicy();//丢弃队列最前面的任务，然后重新提交被拒绝的任务
rejected = new ThreadPoolExecutor.CallerRunsPolicy();//丢弃任务，由调用线程（提交任务的线程）直接执行被丢弃的任务的。

ThreadPoolExecutor 底层工作原理

在这里插入图片描述
举例：8个人进银行办理业务

1~2人被受理（核心大小core）
3~5人进入队列（Queue）
6~8人到最大线程池（扩容大小max）
再有人进来就要被拒绝策略接受了

在工作中单一的/固定数的/可变的三种创建线程池的方法哪个用的多? 坑

答案是一个都不用，工作中配置自定义线程池
Executors 中 JDK 已经给你提供了，为什么不用？
在这里插入图片描述
示例：


/**
 * 线程池配置
 *
 * @author 
 **/
@Configuration
public class ThreadPoolConfig
{
    // 核心线程池大小
    private int corePoolSize = 50;

    // 最大可创建的线程数
    private int maxPoolSize = 200;

    // 队列最大长度
    private int queueCapacity = 1000;

    // 线程池维护线程所允许的空闲时间
    private int keepAliveSeconds = 300;

    @Bean(name = "threadPoolTaskExecutor")
    public ThreadPoolTaskExecutor threadPoolTaskExecutor()
    {
        ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
        executor.setMaxPoolSize(maxPoolSize);
        executor.setCorePoolSize(corePoolSize);
        executor.setQueueCapacity(queueCapacity);
        executor.setKeepAliveSeconds(keepAliveSeconds);
        // 线程池对拒绝任务(无线程可用)的处理策略
        executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy());
        return executor;
    }

    /**
     * 执行周期性或定时任务
     */
    @Bean(name = "scheduledExecutorService")
    protected ScheduledExecutorService scheduledExecutorService()
    {
        return new ScheduledThreadPoolExecutor(corePoolSize,
                new BasicThreadFactory.Builder().namingPattern("schedule-pool-%d").daemon(true).build())
        {
            @Override
            protected void afterExecute(Runnable r, Throwable t)
            {
                super.afterExecute(r, t);
                Threads.printException(r, t);
            }
        };
    }
}

思考题：线程是否越多越好？

一个计算为主的程序（专业一点称为CPU密集型程序）。多线程跑的时候，可以充分利用起所有的cpu核心，比如说4个核心的cpu,开4个线程的时候，可以同时跑4个线程的运算任务，此时是最大效率。但是如果线程远远超出cpu核心数量反而会使得任务效率下降，因为频繁的切换线程也是要消耗时间的。因此对于cpu密集型的任务来说，线程数等于cpu数是最好的了。

如果是一个磁盘或网络为主的程序（IO密集型）。一个线程处在IO等待的时候，另一个线程还可以在
CPU里面跑，有时候CPU闲着没事干，所有的线程都在等着IO，这时候他们就是同时的了，而单线程的话此时还是在一个一个等待的。我们都知道IO的速度比起CPU来是慢到令人发指的。所以开多线程，比方说多线程网络传输，多线程往不同的目录写文件，等等。此时线程数等于IO任务数是最佳的。