第十讲:创建多少线程才是合适的?
引出问题
在Java领域,实现并发程序的主要手段是多线程,使用多线程是简单的,但是使用多少个线程却是个难题?
为什么要使用多线程
本质就是提升程序性能,这个是比较笼统的概念,如何度量性能?核心标准:延迟、吞吐量;
延迟:发出请求到收到响应这个过程的时间(时间维度);
吞吐量:单位时间内能处理请求的数量(空间维度);
同等条件下,延迟越短,吞吐量越大;所谓提升性能,就是降低延迟,提高吞吐量;
多线程的应用场景
举例1: 单核时代,多线程主要是用来平衡CPU和I/O设备;
假设程序按照CPU计算和I/O操作交叉运行,耗时是1:1,单核;
1) 如图所示,只有一个线程,执行CPU计算时,I/O设备空闲,执行I/O操作的时候,
CPU空闲;所以CPU利用率和I/O设备利用率都是50%;
2)如图所示,两个线程,线程A执行CPU计算时,线程B执行I/O操作,线程A执行I/O
操 作时,线程B执行CPU计算,则CPU利用率和I/O设备的利用率就都达到100%;
举例2:多核时代,纯计算型程序,多线程可以降低响应时间;
1)计算1 + 2 + 3 + 4 + 5 ... ...+ 100亿,如果在4核的CPU上利用4个线程执行,
线程A计算[1,25亿),线程B计算 [25亿,50亿), 线程C计算 [50亿,75亿),
线程D计算 [75亿,100亿],理论上应该比一个线程计算[1,100亿]快将近四倍,
响应时间能降到25%;一个线程,对于四核的CPU,CPU利用率只有25%,
四个线程,则能将CPU的利用率提升到100%;
创建多少线程合适
背景:
创建多少线程合适,要看多线程具体的应用场景,程序一般都是CPU计算和
I/O操作交叉执行的,所以分为I/O密集型计算、CPU密集型计算;
计算方式:
1)CPU密集型计算
理论上,"线程数量 = CPU核数",工程上,线程数量一般会设置为"CPU核数+1",
当线程因为偶尔的内存页失效或其他原因导致阻塞时,这个额外的线程可以顶上,
从而保证CPU利用率;
2)I/O密集型计算
在前面的例子中,如果CPU计算和I/O操作的耗时是1:1,那么2个线程最合适;
如果CPU计算和I/O操作的耗时是1:2,那么3个线程最合适,如下图所示,CPU
在A、B、C三个线程之间切换,对于线程A,当CPU从B、C切换回来时,线程A
正好执行完I/O操作,这样CPU和I/O设备的利用率都达到了100%;
综上所述:
单核:最佳线程数=1+(I/O耗时 / CPU耗时)
多核:最佳线程数=CPU核数 * (1+(I/O耗时 / CPU耗时))