线程池
线程是稀缺资源,如果被无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,合理的使用线程池对线程进行统一分配、调优和监控,有以下好处:
- 降低资源消耗
- 提高响应速度
- 提高线程的可管理性。
线程池的作用:
- 线程池作用就是限制系统中执行线程的数量
- 根据系统的环境情况,可以自动或手动设置线程数量,达到运行的最佳效果;少了浪费了系统资源,多了造成系统拥挤效率不高。用线程池控制线程数量,其他线程排队等候。一个任务执行完毕,再从队列的中取最前面的任务开始执行。若队列中没有等待进程,线程池的这一资源处于等待。当一个新任务需要运行时,如果线程池中有等待的工作线程,就可以开始运行了;否则进入等待队列。
为什么要用线程池:
- 减少了创建和销毁线程的次数,每个工作线程都可以被重复利用,可执行多个任务
- 可以根据系统的承受能力,调整线程池中工作线线程的数目,防止因为因为消耗过多的内
存,而把服务器累趴下(每个线程需要大约1MB内存,线程开的越多,消耗的内存也就越大,
最后死机)
系统预定义的线程池:
可缓存线程池
newCachedThreadPool创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收
空闲线程,若无可回收重用时则新建线程。
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
- 工作线程的创建数量几乎没有限制(其实也有限制的,数目为Interger.MAX_VALUE), 这样
可灵活的往线程池中添加线程。 - 如果长时间没有往线程池中提交任务,即如果工作线程空闲了指定的时间(默认为1分钟),
则该工作线程将自动终止。终止后,如果你又提交了新的任务,则线程池重新创建一个工作线
程。 - 在使用CachedThreadPool时,一定要注意控制任务的数量,否则,由于大量线程同时运行,
很有会造成系统瘫痪。
ExecutorService pool=Executors.newCachedThreadPool();
for(int k=0;k<10;k++)
pool.execute(()->{ 向线程池中提交任务,任务是通过Runnable接口进行定义的
for(int i=0;i<10;i++)
System.out.println(Thread.currentThread()+":"+i);
});
pool.shutdown();
特点:
-
重用之前的线程
-
适合执行许多短期异步任务的程序。
-
调用execute() 将重用以前构造的线程
-
如果没有可用的线程,则创建一个新线程并添加到池中
-
默认为60s未使用就被终止和移除
-
长期闲置的池将会不消耗任何资源
定长线程池
newFixedThreadPool 创建一个定长线程池,可控制线程最大并发数,超出的线程会在队列中等待。
public static ExecutorService newFixedThreadPool(int nThreads, ThreadFactory threadFactory) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>(),
threadFactory);
}
-
newFixedThreadPool可控制线程最大并发数,当线程池中的线程数达到其设定大小时,其余
新创建的线程会在LinkedBlockingQueue队列中等待 -
当线程池中的某个线程失败而终止时,新的线程会代替它执行剩下的任务
-
线程池中的线程只有在显式调用shutdown函数时才会退出线程池
ExecutorService newFixedThreadPool = Executors.newFixedThreadPool(3);
for (int i = 0; i < 10; ++i) {
newFixedThreadPool.execute(new Runnable() {
public void run() {
System.out.println(Thread.currentThread().getName());
try {
Thread.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
});
}
特点:
- 创建重用固定数量线程的线程池,不能随时新建线程
- 当所有线程都处于活动状态时,如果提交了其他任务,他们将在队列中等待一个线程可用
- 线程会一直存在,直到调用shutdown
周期定长线程池
newScheduledThreadPool创建一个定长线程池,支持定时及周期性任务执行。
ScheduledExecutorService scheduledThreadPool = Executors.newScheduledThreadPool(3);
DateFormat df=new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
System.out.println(df.format(new Date()));
//定时
scheduledThreadPool.schedule(new Runnable() {
public void run() {
System.out.println("thread:" + Thread.currentThread().getName() + ",time:" + sdf1.format(new Date()));
Thread.sleep(10);
}
}, 3, TimeUnit.SECONDS); 3秒之后开始执行工作任务,除非自定义实现,否则只执行一次
//实际调用的构造器为
public ScheduledThreadPoolExecutor(int corePoolSize) {
super(corePoolSize核心线程数, Integer.MAX_VALUE最大线程数,
DEFAULT_KEEPALIVE_MILLIS, MILLISECONDS,
new DelayedWorkQueue());
}
//循环周期执行
ScheduledExecutorService scheduledThreadPool = Executors.newScheduledThreadPool(3);
DateFormat df=new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
System.out.println(df.format(new Date()));
scheduledThreadPool.scheduleAtFixedRate(()->{
System.out.println(Thread.currentThread()+"-->"+df.format(new Date()));
Thread.sleep(10);
System.out.println("delay 1 seconds, and excute every 3 seconds");
}, 1, 3, TimeUnit.SECONDS); 延迟1秒后开始执行第一次,以后每隔3秒执行一次
特点:
- 设定延迟时间
- 定期执行,空闲线程会进行保留
单线程化线程池
newSingleThreadExecutor创建一个单线程化的线程池,它只会用唯一的工作线程来执行任务,
保证所有任务按照指定顺序(FIFO, LIFO, 优先级)执行
ExecutorService singleThreadPool = Executors.newSingleThreadExecutor();
for(int i = 0 ; i < 50 ; i++)
singleThreadPool.submit(new TestThread((i + 1)));
singleThreadPool.shutdown();
class TestThread implements Runnable{
private String name;
public TestThread(String name){
this.name=name;
}
public void run() {
for(int i=0;i<10;i++){
System.out.println(Thread.currentThread()+"-->"+name);
Thread.yield();
}
}
}
特点:
- 在任何情况下都不会有超过一个任务处于活动状态
- 与newFixedThreadPool(1)不同是不能重新配置加入线程,使用FinalizableDelegatedExecutorService进行包装
- 能保证执行顺序,先提交的先执行
- 当线程执行中出现异常,去创建一个新的线程替换之
周期单线程池
newSingleThreadScheduledExecutor创建一个单线程化的线程池,可以在指定延迟后指定线程任务。
工作窃取算法的线程池
newWorkStealingPool(int)/()创建持有足够数量线程的线程池来支持给定的并行级别,该方法还会使用多个队列来减少竞争,无参则是根据CPU个数定义并行级别。
工作窃取核心思想是,自己的活干完了去看看别人有没有没干完的活,如果有就拿过来帮他干。核心思想是work-stealing工作窃取,ForkJoinPool提供了一个更有效的利用线程的机制,当ThreadPoolExecutor还在用单个队列存放任务时,ForkJoinPool已经分配了与线程数相等的队列,当有任务加入线程池时,会被平均分配到对应的队列上,各线程进行正常工作,当有线程提前完成时,会从队列的末端窃取其他线程未执行完的任务,当任务量特别大时,CPU多的计算机会表现出更好的性能。
实现机制是:为每个工作线程分配一个双端队列(本地队列)用于存放需要执行的任务,当自己的队列没有数据的时候从其它工作者队列中获得一个任务继续执行。
CountDownLatch latch=new CountDownLatch(10);
ExecutorService es=Executors.newWorkStealingPool(2);
Random r=new Random();
for(int i=0;i<10;i++)
es.submit(new MyRunnable(r.nextInt(10), latch));
latch.await();
System.out.println("....end....");
class MyRunnable implements Runnable{
private int len;
private CountDownLatch latch;
public MyRunnable(int len,CountDownLatch latch){
this.len=len;
this.latch=latch;
}
public void run() {
try{
System.out.println(Thread.currentThread());
try{
Thread.sleep(200*len);
} catch(InterruptedException e){
e.printStackTrace();
}
} finally{
latch.countDown();
}
}
}
另外Java 8为ForkJoinPool添加了一个通用线程池,这个线程池用来处理那些没有被显式提交到任何线程池的任务。它是ForkJoinPool类型上的一个静态元素,它拥有的默认线程数量等于运行计算机上的处理器数量。当调用Arrays类上添加的新方法时,自动并行化就会发生。比如用来排序一个数组的并行快速排序,用来对一个数组中的元素进行并行遍历。自动并行化也被运用在Java 8新添加的Stream API中parallelStream()方法
常见的五种线程池的适应场景
newCachedThreadPool
用来创建一个可以无限扩大的线程池,适用于服务器负载较轻,执行很多短期异步任务。
newFixedThreadPool
创建一个固定大小的线程池,因为采用无界的阻塞队列,所以实际线程数量永远不会变化,适用于可以预测线程数量的业务中,或者服务器负载较重,对当前线程数量进行限制。
newSingleThreadExecutor
创建一个单线程的线程池,适用于需要保证顺序执行各个任务,并且在任意时间点,不会有多个线程是活动的场景。
newScheduledThreadPool
可以延时启动,定时启动的线程池,适用于需要多个后台线程执行周期任务的场景。
newWorkStealingPool
创建一个拥有多个任务队列的线程池,可以减少连接数,创建当前可用cpu数量的线程来并行执行,适用于大耗时的操作,可以并行来执行
线程池的7大参数
ThreadPoolExecutor参数含义
序号 | 名称 | 类型 | 含义 |
---|---|---|---|
1 | corePoolSize | int | 核心线程池大小 |
2 | maximumPoolSize | int | 最大线程池大小 |
3 | keepAliveTime | long | 线程最大空闲时间 |
4 | unit | TimeUnit | 时间单位 |
5 | workQueue | BlockingQueue<Runnable> | 线程等待队列 |
6 | threadFactory | ThreadFactory | 线程创建工厂 |
7 | handler | RejectedExecutionHandler | 拒绝策略 |
任务调度算法
- 如果当前线程池线程个数小于corePoolSize则开启新线程
- 否则添加任务到阻塞队列
- 如果任务队列满了,则尝试新开启线程执行任务,如果线程>maximumPoolSize则执行RejectedExecutionHandler。
工作队列
1、无界队列:队列大小无限制,常用的为无界的LinkedBlockingQueue,当任务耗时较长时可能会导致大量新任务在队列中堆积最终导致OOM。
2、有界队列:常用的有两类,一类是遵循FIFO原则的队列如ArrayBlockingQueue与有界的LinkedBlockingQueue,另一类是优先级队列如PriorityBlockingQueue
PriorityBlockingQueue中的优先级由任务的Comparator决定。
使用有界队列时队列大小需和线程池大小互相配合,线程池较小有界队列较大时可减少内存消耗,降低cpu使用率和上下文切换,但是可能会限制系统吞吐量。实际开发中一般应该使用有界队列。
3、同步移交队列:如果不希望任务在队列中等待而是希望将任务直接移交给工作线程,可使用SynchronousQueue作为等待队列
SynchronousQueue不是一个真正的队列,而是一种线程之间移交的机制。要将一个元素放入
SynchronousQueue中,必须有另一个线程正在等待接收这个元素。只有在使用无界线程池或者有饱和策略时才建议使用该队列。
JAVA提供4种饱和策略
1、AbortPolicy直接抛出异常。
2、CallerRunsPolicy只用调用所在的线程运行任务。
3、DiscardOldestPolicy丢弃队列里最近的一个任务,并执行当前任务。
4、DiscardPolicy不处理,丢弃掉。
任务队列、核心线程数、最大线程数的逻辑关系
- 当线程数小于核心线程数时,创建线程
- 当线程数大于等于核心线程数,且任务队列未满时,将任务放入任务队列
- 当线程数大于等于核心线程数,且任务队列已满
- 若线程数小于最大线程数,创建线程
- 若线程数等于最大线程数,调用拒绝执行处理程序(默认效果为:抛出异常,拒绝任务)
线程池相关的主要方法
java.util.concurrent.ExecutorService是java线程池框架的主要接口,用Future保存任务的运行状态
及计算结果,主要方法有:
-
void execute(Runnable)提交任务到线程池
-
Future submit(Runnable)提交任务到线程池并返回Future
-
Future submit(Runnable, T) 提交任务到线程池并返回Future, 第二个参数会作为计算结果封装到Future
-
Future submit(Callable)提交任务到线程池并返回Future,call方法的计算结果会封装到Future
-
List invokeAll(Collection extends Callable>) 批量提交任务并返回计算结果
-
T invokeAny(Collectionextends Callable> tasks) 只执行其中一个任务并返回结果
-
void shutdown() 线程池不再接受新任务,继续运行正在执行中的任务及等待中的任务
-
List shutdownNow() 线程池不再接受新任务,继续运行正在执行中的任务,返回待执行的任务列表
线程池的关闭
shutdownNow:对正在执行的任务全部发出interrupt(),停止执行,对还未开始执行的任务全部取消,并且返回还没开始的任务列表shutdown:当调用shutdown后,线程池将不再接受新的任务,但也不会去强制终止已经提交或者正在执行中的任务
创建线程池的核心参数
- corePoolSize与maximumPoolSize。corePoolSize核心线程池大小,线程池刚启动时来一个任务就会创建一个线程去执行这个任务,直到达到corePoolSize个线程,这时再来的任务就会加到任务队列中去,直到任务队列满了,这时会尝试创建新的线程,但是总线程数量必须少于maximumPoolSize,如果线程也不能创建了,这时就会拒绝执行任务了
- workQueue 线程池所使用的任务阻塞队列,该阻塞队列的长度决定了能够缓冲任务的最大数量,queueCapacity任务队列容量
- keepAliveTime表示线程没有任务执行时最多保持多久时间会终止
参数的设置跟系统的负载有直接的关系,系统负载的相关参数:tasks每秒需要处理的最大任务数量;tasktime处理第个任务所需要的时间;responsetime系统允许任务最大的响应时间,比如每个任务的响应时间不得超过2秒。
如何合理配置线程池的大小
任务性质可分为:CPU密集型任务,IO密集型任务,混合型任务。
- 对于计算密集型的任务,一个有N cpu个处理器的系统通常通过使用一个N cpu+1个线程的线程池来得最优的利用率
- 对于IO密集型任务,包含了I/O和其他阻塞操作的任务,可以设置为2*N cpu
- 最优的线程池的大小等于 【((线程等待时间+线程CPU时间)/线程CPU时间 )* CPU数目 】
- 比如平均每个线程CPU运行时间为0.5s,而线程等待时间(非CPU运行时间,比如IO)为1.5s,CPU核心数为8,那么根据上面这个公式估算得到:((0.5+1.5)/0.5)*8=32
可以先将线程池大小设置为参考值,再观察任务运行情况和系统负载、资源利用率来进行适当调整。
Runtime.getRuntime().availableProcessors():int获取CPU的核数
多线程有什么用
- 发挥多核CPU的优势。随着工业的进步,现在的笔记本、台式机乃至商用的应用服务器至少也都是双核的,4核、8核甚至16核的也都不少见,如果是单线程的程序,那么在双核CPU上就浪费了50%,在4核CPU上就浪费了75%。单核CPU上所谓的多线程那是假的多线程,同一时间处理器只会处理一段逻辑,只不过线程之间切换得比较快,看着像多个线程"同时"运行罢了。多核CPU上的多线程才是真正的多线程,它能让你的多段逻辑同时工作,多线程,可以真正发挥出多核CPU的优势来,达到充分利用CPU的目的。
- 防止阻塞。从程序运行效率的角度来看,单核CPU不但不会发挥出多线程的优势,反而会因为在单核CPU上运行多线程导致线程上下文的切换,而降低程序整体的效率。但是单核CPU还是要应用多线程,就是为了防止阻塞。试想,如果单核CPU使用单线程,那么只要这个线程阻塞了,比方说远程读取某个数据吧,对端迟迟未返回又没有设置超时时间,那么你的整个程序在数据返回回来之前就停止运行了。多线程可以防止这个问题,多条线程同时运行,哪怕一条线程的代码执行读取数据阻塞,也不会影响其它任务的执行。
- 便于建模。假设有一个大的任务A,单线程编程,那么就要考虑很多,建立整个程序模型比较麻烦。但是如果把这个大的任务A分解成几个小任务,任务B、任务C、任务D,分别建立程序模型,并通过多线程分别运行这几个任务,那就简单很多了。
什么是线程安全
如果你的代码在多线程下执行和在单线程下执行永远都能获得一样的结果,那么你的代码就是线程安全的。
- 不可变:像String、Integer、Long这些,都是final类型的类,任何一个线程都改变不了它们的值,要 改变除非新创建一个,因此这些不可变对象不需要任何同步手段就可以直接在多线程环境下使用。final能够做出如下保证:当你创建一个对象时,使用final关键字能够使得另一个线程不会访问到处于“部分创建”的对象。final类型的成员变量的值,包括那些用final引用指向的collections的对象,是读线程安全而无需使用synchronization的
- 绝对线程安全:不管运行时环境如何,调用者都不需要额外的同步措施。要做到这一点通常需要付出许多额外的代价,Java中标注自己是线程安全的类,实际上绝大多数都不是线程安全的,不过绝对线程安全的类,Java中也有,比方说CopyOnWriteArrayList、CopyOnWriteArraySet
- 相对线程安全:相对线程安全也就是我们通常意义上所说的线程安全,像Vector这种,add、remove方法都是原子操作,不会被打断,但也仅限于此,如果有个线程在遍历某个Vector、有个线程同时在add这个Vector,99%的情况下都会出现ConcurrentModificationException,也就是fail-fast机制。
- 线程非安全:ArrayList、LinkedList、HashMap等都是线程非安全的类
线程通信
题目:有两个线程A、B,A线程向一个集合里面依次添加元素abc字符串,一共添加十次,当添加到第五次的时候,希望B线程能够收到A线程的通知,然后B线程执行相关的业务操作。
方式一:使用 volatile 关键字
基于 volatile 关键字来实现线程间相互通信是使用共享内存的思想,大致意思就是多个线程同时监听一个变量,当这个变量发生变化的时候 ,线程能够感知并执行相应的业务。这也是最简单的一种实现方式
方式2:生产者消费者模式
Object类提供了线程间通信的方法:wait()、notify()、notifyaAll(),它们是多线程通信的基础,
而这种实现方式的思想自然是线程间通信。
注意: wait和notify必须配合synchronized使用,wait方法释放锁,sleep方法不释放锁
方式3:使用Lock和Condition控制线程通信
- await()导致当前线程等待,知道其它线程调用该条件变量的signal方法唤醒
- signal()唤醒Lock对象上等待的单个线程,如果有多个等待线程,则随机选中一个唤醒。只有当前线程unlock后才能执行唤醒线程
- signalAll()唤醒Lock对象上所有的等待线程
线程B在被A唤醒之后由于没有获取锁还是不能立即执行,也就是说,A在唤醒操作之后,并不释放锁。
方式4:CountDownLatch
jdk1.5后在java.util.concurrent包下提供了很多并发编程相关的工具类,简化了并发编程代码的书
写,CountDownLatch基于AQS框架,相当于也是维护了一个线程间共享变量state
方式5:LockSupport实现线程间的阻塞和唤醒
LockSupport是一种非常灵活的实现线程间阻塞和唤醒的工具,使用它不用关注是等待线程先进行还是唤醒线程先运行,但是得知道线程的名字。