1. 64 thread block,(40,40) threads per block
显然这是错误的。一块允许的最大线程数量是1024,每个维上允许的最大的线程数量。一定要搞清这个概念。
所以,最后只能开(32,32)threads per block,64 threads block.
1. 64 thread block,(40,40) threads per block
显然这是错误的。一块允许的最大线程数量是1024,每个维上允许的最大的线程数量。一定要搞清这个概念。
所以,最后只能开(32,32)threads per block,64 threads block.