如何估算吞吐量与线程池大小

最新推荐文章于 2021-09-17 15:34:44 发布

刀剑如梦TOTO333

最新推荐文章于 2021-09-17 15:34:44 发布

阅读量311

点赞数

分类专栏：笔记多线程

原文链接：https://chanjarster.github.io/post/concurrent-programming/throughput-and-thread-pool-size/

版权

笔记同时被 2 个专栏收录

56 篇文章 0 订阅

订阅专栏

多线程

8 篇文章 0 订阅

订阅专栏

验证代码

估算吞吐量

估算线程池大小

验证代码

用Thread.sleep() 模拟计算过程，因为计算的过程不会释放锁。

用object.wait() 模拟等待io的过程，因为等待io会释放锁。

@Test
	public void testThroughPutByMultiThread() throws InterruptedException {
		final Object lock = new Object();
		List<Thread> list = new ArrayList<>();
		StopWatch stopWatch = new StopWatch("testThroughPutByMultiThread");
		stopWatch.start("testConsumeTime");
		for(int i=0;i<5;i++) {
			int finalI = i;
			Thread thread = new Thread(new Runnable() {
				@Override
				public void run() {
					synchronized (lock) {
						// 计算部分
						try {
							System.out.println("线程" + finalI + "进入临界区");
							Thread.sleep(1000L);
							System.out.println("线程" + finalI + "计算完成");
							// 等待io
							lock.wait(2000L);
							System.out.println("线程" + finalI + "等待io完成");
						} catch (InterruptedException e) {
							e.printStackTrace();
						} finally {
							lock.notify();
						}
					}
				}
			});
			list.add(thread);
			thread.start();
		}

		for (Thread thread : list) {
			thread.join();
		}
		stopWatch.stop();
		System.out.println(stopWatch.prettyPrint());

	}

估算吞吐量

现在有一个task，它的执行时间分为2部分，第一部分做数学运算，第二部分等待IO。这两部分就是所谓的计算操作与等待操作。

假设这个task使用单CPU，开10个线程处理10个任务，计算部分花费1秒，等待部分花费9秒，在单核CPU的情况下可以得到下面的执行图（其实就是《计算机组成原理的流水线模型》）：

图中的蓝色线条是等待调度，橙色线条是执行计算任务，绿色线条是CPU等待花费的时间。

这个图的吞吐量就显而易见了：

throughput = 10 tasks / (10 * computing time + wait time) 
           = 10 tasks / (10 * 1s + 9s) 
           = 10 / 19s = 0.526 tasks/s

如果我们现在有一个task使用双核CPU，那么会怎样呢？

可以看到因为有了2个CPU核心，计算任务可以重叠，进而花费的时间减半，吞吐量为：

throughput = 10 tasks / (10 * computing time / 2 + wait time) 
           = 10 tasks / (10 * 1s / 2 + 9s) 
           = 10 / 14s = 0.7142 tasks/s

那么总结一下吞吐量计算公式：

Throughput：吞吐量。
Tn：task数量。
C：CPU数量。可以有小数，比如0.5，代表只提供一半的算力。
Tc：task计算所花费的时间。
Tw：task等待花费的时间。
E：最后一个task完成所消耗的时间。

公式中C=1的意思是CPU 100%的全速工作，如果C=0.5那么意思就是CPU有50%的空闲时间，如果C=2则代表启动了两颗CPU全速运行。

可以看到想要提升吞吐量有：

提高C，提高CPU核数。
降低Tc，降低计算时间，通过优化代码。
降低Tw，降低等待io时间，通过优化网络，优化响应端代码等。

总的来说就是使用更多的CPU核，让task运行时间更短。

也许你觉得还可以通过提升Tn来提高吞吐量，比如下面这个图：

可以看到吞吐量随着任务数量的上升而上升，那么是不是会一直长呢？答案是不会的，当Tn越来越大的时候，Tn * Tc / C 也会越来越大，那么可以忽略掉Tw，公式就变成了 C / Tc，这值就是理论上的吞吐量上界，增加Tn只会无限趋近于这个值。

估算线程池大小

那么问题来了，如何知道要开多少个线程能够让CPU达到目标利用率？

这个要看下面的公式：

N：CPU数量。
U：CPU利用率，0.1代表10%，1代表100%。
C：用到CPU的时间。
W：等待时间。

注：本公式里的 N * U = 吞吐量公式中的C。

如果U=1（利用率100%），决定线程数量的是W与C的比，当W越高时则需要越多的线程，当W=0时，只需要与N同样的线程即可。

这个公式也告诉我们盲目开启更多的线程不会带来额外的好处，还会造成反效果（增加的线程调度开销），所以在实践中都会使用具有上界的线程池。

而且在实际做性能调优的时候，会在计算得到的数字左右调整线程池大小，以达到最好效果。

刀剑如梦TOTO333

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
如何估算吞吐量与线程池大小

如何估算吞吐量以及线程池大小March 21, 2019估算吞吐量现在有一个task，它的执行时间分为2部分，第一部分做数学运算，第二部分等待IO。这两部分就是所谓的计算操作与等待操作。那么现在要求估算在CPU火力全开的情况下，执行这个task能够达到的吞吐量峰值是多少？那么我们要先知道执行这个task总共需要多少时间，计算部分花费多少时间，等待部分花费多少时间。假设这个task的计算部分花费1秒，等待部分花费9秒，并且开了10个线程执行10个task，在单核CPU的情况下可以.
复制链接

扫一扫

专栏目录