【Java笔记】多线程1：线程池大小为什么设置N+1或2N？CPU密集型？IO密集型？

Hansdas

已于 2024-04-19 23:19:55 修改

阅读量738

点赞数 13

分类专栏： Java 文章标签： java 笔记面试

于 2024-04-07 15:07:52 首次发布

本文链接：https://blog.csdn.net/hansdas/article/details/137461063

版权

Java 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

经典面试题：线程池设置多大合适

文章目录

经典面试题：线程池设置多大合适
1. N
- 1.1 什么是N
- 1.2 如何查看N
2. IO密集型运算与CPU密集型运算
3. 为什么是2N？又为什么是N+1？
- 3.1 为什么IO密集型运算最大线程数是2N?
- 3.2 为什么CPU密集型运算的最大线程数是N+1
Reference

大家都知道这个问题需要根据不同场景来回答：

CPU密集型运算：N+1
IO密集型运算：2N

那么，就有几个问题：

N是什么？
什么是IO密集型运算？什么又是CPU密集型运算？
为什么是2N？又为什么是N+1？

下面就稍微梳理下

1. N

1.1 什么是N

需要注意的是，N是最大并行数，而不是“X核CPU”的X。
一般我们会听到例如“4核8线程”的说法，这里的8就是N，虽然只有4个CPU（核心），但是可以利用超线程技术把原来CPU4个线程虚拟成8个。

1.2 如何查看N

Runtime.getRuntime().availableProcessors();

会返回计算机的最大并行数

2. IO密集型运算与CPU密集型运算

IO密集型运算：就是指需要频繁输入输出的场景，这里的IO不仅包括操作数据库时的磁盘-内存IO，也包括网络远程调用的IO。
CPU密集型运算：CPU运算需求高的场景，比如循环次数很多，或者递归调用层次很深等

3. 为什么是2N？又为什么是N+1？

首先要明确，2N跟N+1都是经验值，大家能明白大概的逻辑就行

3.1 为什么IO密集型运算最大线程数是2N?

这个有一个公式：

理想线程数=最大并行数*期望CPU利用率*(CPU计算时间+等待时间)/CPU计算时间

下面我们试图理解一下。首先先明公式里几个变量的意义：

最大并行数：就是前面说的N
期望CPU利用率：最理想的情况肯定是希望利用率100%（发热严重？那不管我事）
CPU计算时间：就是字面意思
等待时间：等待数据IO的时间

首先要明确，在涉及大量数据IO的场景下，CPU利用率最高的时候是什么时候？肯定是当任务A在等待IO时，CPU可以切到任务B进行CPU运算，保证CPU不会因为等待IO而停下来。

因此会有最大并行数*(CPU计算时间+等待时间)/CPU计算时间
如果理想地认为CPU计算时间等于等待时间，那么就是2N了。

当然大部分场景下这是不可能的，一般Web项目中IO时间，也就是上面说的CPU等待时间，都远高于CPU处理时间（因此MySQL才会用B+树做索引来减小每查找一层增加的IO）。比如一个简单的数据库查询，计算可能只有0.1ms，IO则可能达到2ms，这样一算，得21N了。所以2N只是个理想的经验值，在高IO时间开销的场景，可以是10N、20N、30N等等。

3.2 为什么CPU密集型运算的最大线程数是N+1

回到我们的出发点：希望CPU一刻不停的工作。
CPU密集型运算场景下，我们就不再考虑IO了。这时候CPU空闲的原因一般就是正在处理的任务出现错误，暂停了。这个时候如果我们有另一个任务恰好补上来，那CPU就没得歇了。所以是N+1。当然这也是经验值。

网上也有说法是，CPU密集型运算的最大线程数可以设置在N~2N，这个也不难理解，如果我们N个实际线程都在处理任务，他们发生了错误，每个都有个替补的补上，这就是2N了。

但1.5N或者2N之类比较大的线程数也不一定是最好的，前面的一切分析都是基于“提高CPU利用率”这个目的，但是不一定代表速度就快，对于任务失败可能性比较低的场景，设2N属于纯粹没事找事，因为并不需要这么多候补的任务，多出来的一起排队反而是给缓存上强度，上下文切换的时候开销更大了（大概）。之前由朋友做课程实验，是起多个线程并行做矩阵运算，发现其实N是最快的，因为矩阵运算失败可能性很小。

Reference

https://blog.csdn.net/Cover_sky/article/details/121371973
https://cloud.tencent.com/developer/article/1730603

Hansdas

关注

13
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
【Java笔记】多线程1：线程池大小为什么设置N+1或2N？CPU密集型？IO密集型？

需要注意的是，N是最大并行数，而不是“X核CPU”的X。一般我们会听到例如“4核8线程”的说法，这里的8就是N，虽然只有4个CPU（核心），但是可以利用超线程技术把原来CPU4个线程虚拟成8个。首先要明确，2N跟N+1都是经验值，大家能明白大概的逻辑就行。
复制链接

扫一扫