nni提供了设置并发的方式训练
默认是等于1,这里设置成了2
接下来对比了一下,并发数1和2的训练时间的差别
并发数=1:
可以看到是20多分钟就结束了,平均不到3分钟就可以训练一个trial
然后当设置并发数=2:
速度慢了很多,反而达不到加速的效果
说明nni使用cpu,没法使用并发进行加速,起码在本地来说
并发数=2我们看一下cpu运行状态
不知道是不是计算是cpu资源不够用,亦或者是python对多线程支持很差的缘故
反正要是在单机上运行cpu训练,最好不要设置并发数
最后一个运行相对快很多,是因为前面7个训练完成,剩下的最后一个是8核进行运算的