由于最近实验需要在GPU上狠下功夫,所以恶补了GPU的知识。我发现国内blog其实对GPU内部的物理、逻辑的各个组件、对存储单元等总结的并不是特别完备,所以我根据自己的理解以及他人的博客中的内容自己总结了一份GPU相关知识点,用来帮助自己回顾并普及知识。本文承接上一篇
二、GPU逻辑执行结构
软件概念:
thread-->block-->grid:在利用cuda进行编程时,一个kernel对应一个GRID(http://blog.sina.com.cn/s/blog_80ce3a550101lntp.html),一个grid分为多个block,而一个block分为多个thread,GRID跑在GPU上的时候,可能是独占一个GPU的,也可能是多个kernel并发占用一个GPU的(需要fermi及更新的GPU架构支持)。其中任务划分到是否影响最后的执行效果。划分的依据是任务特性和GPU本身的硬件特性。GRID,BLOCK,THREAD是软件概念,而非硬件的概念。