对于给定内核数的CPU开多少个线程主要取决于所处理的问题类型
(1)对于CPU密集型任务,这类任务在执行的时候会耗费大量的CPU资源,如果开启大量的线程,线程之间就会争抢cpu资源,cpu内核需要频繁切换线程造成额外的开销,降低性能。这时候为了提高CPU的利用率开启的线程数理论上应该等于cpu的内核数,但是通常把线程数设为值cpu内核数+1,会实现最优的利用率。这是因为即使某个线程因为某种原因而出现阻塞,额外的线程也能保证cpu的时钟周期不被浪费。
(2)对于I/O密集型任务,由于cpu的运行速度比I/O设备运行速度快得多,所以任务的大量时间用于等待I/O处理,这时候的cpu会有大量的时间处于空闲状态。所以对于I/O密集型任务应该设置的线程数是cpu内核的数倍,这样才能最大限度的利用cpu资源。I/O设备的处理时间占用越长应该设置的线程数就更多,这样能保证一个线程在处于I/O设备处理时别的线程能够利用cpu资源进行处理。
(3)除此之外,开启的线程数量还和编程语言本身的特性有关。
- go语言本身的限制,go程序在启动是,会设置M的最大数量,默认是一万,但是内核很难支撑这么多的线程,这个限制可以忽略
- runtime/debug中的SetMaxThreads函数,设置了M(线程)的最大数量
- 一个M线程发生了阻塞,会创建新的M线程,如果一个线程M发生了阻塞,会创建一个新的线程来服务阻塞线程的本地队列P