【Java笔记】多线程1:线程池大小为什么设置N+1或2N?CPU密集型?IO密集型?

经典面试题:线程池设置多大合适


大家都知道这个问题需要根据不同场景来回答:

  • CPU密集型运算:N+1
  • IO密集型运算:2N

那么,就有几个问题:

  1. N是什么?
  2. 什么是IO密集型运算?什么又是CPU密集型运算?
  3. 为什么是2N?又为什么是N+1?

下面就稍微梳理下

1. N

1.1 什么是N

需要注意的是,N是最大并行数,而不是“X核CPU”的X。
一般我们会听到例如“4核8线程”的说法,这里的8就是N,虽然只有4个CPU(核心),但是可以利用超线程技术把原来CPU4个线程虚拟成8个。

1.2 如何查看N

Runtime.getRuntime().availableProcessors();

会返回计算机的最大并行数

2. IO密集型运算与CPU密集型运算

  • IO密集型运算:就是指需要频繁输入输出的场景,这里的IO不仅包括操作数据库时的磁盘-内存IO,也包括网络远程调用的IO。
  • CPU密集型运算:CPU运算需求高的场景,比如循环次数很多,或者递归调用层次很深等

3. 为什么是2N?又为什么是N+1?

首先要明确,2N跟N+1都是经验值,大家能明白大概的逻辑就行

3.1 为什么IO密集型运算最大线程数是2N?

这个有一个公式:

理想线程数=最大并行数*期望CPU利用率*(CPU计算时间+等待时间)/CPU计算时间

下面我们试图理解一下。首先先明公式里几个变量的意义:

  • 最大并行数:就是前面说的N
  • 期望CPU利用率:最理想的情况肯定是希望利用率100%(发热严重?那不管我事)
  • CPU计算时间:就是字面意思
  • 等待时间:等待数据IO的时间

首先要明确,在涉及大量数据IO的场景下,CPU利用率最高的时候是什么时候?肯定是当任务A在等待IO时,CPU可以切到任务B进行CPU运算,保证CPU不会因为等待IO而停下来。

因此会有 最大并行数*(CPU计算时间+等待时间)/CPU计算时间
如果理想地认为CPU计算时间等于等待时间,那么就是2N了。

当然大部分场景下这是不可能的,一般Web项目中IO时间,也就是上面说的CPU等待时间,都远高于CPU处理时间(因此MySQL才会用B+树做索引来减小每查找一层增加的IO)。比如一个简单的数据库查询,计算可能只有0.1ms,IO则可能达到2ms,这样一算,得21N了。所以2N只是个理想的经验值,在高IO时间开销的场景,可以是10N、20N、30N等等。

3.2 为什么CPU密集型运算的最大线程数是N+1

回到我们的出发点:希望CPU一刻不停的工作。
CPU密集型运算场景下,我们就不再考虑IO了。这时候CPU空闲的原因一般就是正在处理的任务出现错误,暂停了。这个时候如果我们有另一个任务恰好补上来,那CPU就没得歇了。所以是N+1。当然这也是经验值。

网上也有说法是,CPU密集型运算的最大线程数可以设置在N~2N,这个也不难理解,如果我们N个实际线程都在处理任务,他们发生了错误,每个都有个替补的补上,这就是2N了。

但1.5N或者2N之类比较大的线程数也不一定是最好的,前面的一切分析都是基于“提高CPU利用率”这个目的,但是不一定代表速度就快,对于任务失败可能性比较低的场景,设2N属于纯粹没事找事,因为并不需要这么多候补的任务,多出来的一起排队反而是给缓存上强度,上下文切换的时候开销更大了(大概)。之前由朋友做课程实验,是起多个线程并行做矩阵运算,发现其实N是最快的,因为矩阵运算失败可能性很小。

Reference

https://blog.csdn.net/Cover_sky/article/details/121371973
https://cloud.tencent.com/developer/article/1730603

  • 13
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是Java多线程编程学习笔记之十二:生产者—消费者模型的相关内容和代码。 ## 生产者—消费者模型简介 生产者—消费者模型是一种常见的多线程并发模型,它涉及到两个角色:生产者和消费者。生产者负责生产据,消费者负责消费据。生产者和消费者通过一个共享的缓冲区进行通信,生产者将据放入缓冲区,消费者从缓冲区获取据。 在多线程编程中,生产者—消费者模型的实现有多种方式,本文将介绍一种基于Java的实现方式。 ## 生产者—消费者模型的实现 ### 1. 定义共享缓冲区 共享缓冲区是生产者和消费者进行通信的桥梁,它需要实现以下功能: - 提供一个put方法,允许生产者将据放入缓冲区; - 提供一个take方法,允许消费者从缓冲区获取据; - 当缓冲区已满时,put方法应该等待; - 当缓冲区为空时,take方法应该等待。 以下是一个简单的共享缓冲区的实现: ```java public class Buffer { private int[] data; private int size; private int count; private int putIndex; private int takeIndex; public Buffer(int size) { this.data = new int[size]; this.size = size; this.count = 0; this.putIndex = 0; this.takeIndex = 0; } public synchronized void put(int value) throws InterruptedException { while (count == size) { wait(); } data[putIndex] = value; putIndex = (putIndex + 1) % size; count++; notifyAll(); } public synchronized int take() throws InterruptedException { while (count == 0) { wait(); } int value = data[takeIndex]; takeIndex = (takeIndex + 1) % size; count--; notifyAll(); return value; } } ``` 上面的Buffer类使用一个组来表示缓冲区,size表示缓冲区的大小,count表示当前缓冲区中的元素量,putIndex和takeIndex分别表示下一个可写和可读的位置。put和take方法都是同步方法,使用wait和notifyAll来进行线程间的等待和通知。 ### 2. 定义生产者和消费者 生产者和消费者都需要访问共享缓冲区,因此它们都需要接收一个Buffer对象作为参。以下是生产者和消费者的简单实现: ```java public class Producer implements Runnable { private Buffer buffer; public Producer(Buffer buffer) { this.buffer = buffer; } public void run() { try { for (int i = 0; i < 10; i++) { buffer.put(i); System.out.println("Produced: " + i); Thread.sleep((int)(Math.random() * 1000)); } } catch (InterruptedException e) { e.printStackTrace(); } } } public class Consumer implements Runnable { private Buffer buffer; public Consumer(Buffer buffer) { this.buffer = buffer; } public void run() { try { for (int i = 0; i < 10; i++) { int value = buffer.take(); System.out.println("Consumed: " + value); Thread.sleep((int)(Math.random() * 1000)); } } catch (InterruptedException e) { e.printStackTrace(); } } } ``` 生产者在一个循环中不断地向缓冲区中放入据,消费者也在一个循环中不断地从缓冲区中获取据。注意,当缓冲区已满时,生产者会进入等待状态;当缓冲区为空时,消费者会进入等待状态。 ### 3. 测试 最后,我们可以使用下面的代码来进行测试: ```java public class Main { public static void main(String[] args) { Buffer buffer = new Buffer(5); Producer producer = new Producer(buffer); Consumer consumer = new Consumer(buffer); Thread producerThread = new Thread(producer); Thread consumerThread = new Thread(consumer); producerThread.start(); consumerThread.start(); } } ``` 在上面的代码中,我们创建了一个缓冲区对象和一个生产者对象和一个消费者对象,然后将它们分别传递给两个线程,并启动这两个线程。 运行上面的代码,我们可以看到生产者和消费者交替地进行操作,生产者不断地向缓冲区中放入据,消费者不断地从缓冲区中获取据。如果缓冲区已满或者为空,生产者和消费者会进入等待状态,直到缓冲区中有足够的空间或者有新的据可用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值