在Windows中:
输入nvidia-smi
在Ubuntu中:
nvcc --version
什么是网格?
并行计算,还是多线程编程。不过,此时每一个线程运行的函数一样!
这样就有了线程快的概念。一大堆相同的线程,构成了一个线程块。一大堆线程块,构成了一个网格。
线程块数(又称网格大小)
×
\times
× 线程块中的线程数(又称线程块大小)=总线程数。每一个主函数都对应一个网格。
类比(迁移):
四年级的学生要考试。
四年级->网格
四年级1班->第0个线程块
四年级2班->第1个线程块
四年级3班->第2个线程块
四年级1班1号小明->第0个线程块的第一个线程
四年级1班2号小红->第0个线程块的第二个线程
此时,四年级每一个学生都在做一样的事情(函数)那就是做卷子。每个年级3个班,每个班20人,那么1个小时考试时间结束,可以做完3
×
\times
× 20=60份卷子,这就是并行的好处。