逻辑层面上,一个grid上的所有线程都是并行的,但这仅仅是逻辑层面,物理层面上肯定做不到百万级别的线程并行。就好像CPU线程,物理并行能力要看CPU核数,GPU的并行能力要看线程束(warp)的大小。 一、什么是线程束