前言
做为程序员多线程大家应该不陌生,但是业务如果不能指定线程数,而且需要处理流数据时,如何才能最大程度的发挥服务器的性能呢(暂不考虑cpu以外的性能瓶颈)。
线程与CPU的关系
众所周知,程序的运算,是交由cpu来执行的,具体来讲,是由cpu的核心来完成的,一个核心同时只能运行一个线程。那么问题来了,既然一个核心只能同时运行一个线程,是否线程数最大设置为cpu核心数就可以了呢?并不是,虽然一个cpu核心同时只能运行一个线程,但是线程并不是时时刻刻占用着cpu核心(除非是计算密集型),当你的线程执行IO操作时,它是不占用cpu资源的,比如一个线程运行完耗时1s,但是可能IO耗时0.5s,运算只用0.5s,此时如果线程数设置为cpu核心数,那么一半的时间cpu都是空闲的,会极大的浪费资源。
cpu核心的概念
1、物理核:
真实的cpu核,有独立的电路元件以及L1,L2缓存,可以独立地执行指令。
2、逻辑核:
CPU运用了超线程的技术,这个技术可以让一个实体CPU核心模拟出2个逻辑线程,这就是为什么逻辑线程会是核心数的2倍的原因。(上面所说的线程执行占用一个核心,说的也是逻辑核)
线程数计算公式
线程数 =CPU逻辑核心数 x cpu利用率 x (1 + 等待时间/计算时间)