GPU
文章平均质量分 64
wondervictor
这个作者很懒,什么都没留下…
展开
-
《CUDA By Example》【Chapter 10】流?
10.1 概述 并行性分数据并行性和任务并行性。GPU是SIMD天生的数据并行,同时也能支持类似于CPU多线程应用程序中的任务并行性。 GPU任务并行性不像CPU上那样灵活,但仍然可以进一步提高GPU上的运行速度。本章,介绍CUDA流,以及如何通过流在GPU上同时执行多个任务。 了解如何分配也锁定(Page-Locked)类型的主机内存 了解CUDA流的概念 了解如何使用CUDA流...原创 2018-06-08 16:05:58 · 257 阅读 · 0 评论 -
《CUDA By Example》【Chapter 09】原子性?
9.1 概述 了解不同NVIDIA GPU的计算功能集 了解原子操作以及为什么需要使用 了解如何在CUDA C核函数中执行带有原子操作的运算 9.2 计算功能集 不同架构的CPU有不同的功能和指令集(如MMX,SSE,SSE2),对于CUDA支持的GPU也一样。NVIDIA将GPU支持的各种功能统称为计算功能集(Compute Capability)。 9.2.1 NVIDIA...原创 2018-06-07 17:50:32 · 244 阅读 · 0 评论 -
《CUDA By Example》【Chapter 07】纹理内存 ?
7.1 本章目标 纹理内存和常量内存一样,都是只读内存,用来减少带宽流量,提升性能。 1,了解纹理内存的特性 2,了解如何在CUDA C中使用一维纹理内存 3,了解如何在CUDA C中使用二维纹理内存 7.2 纹理内存简介(Texture Memory) 7.3 热传导模拟...原创 2018-06-06 17:14:03 · 265 阅读 · 0 评论 -
《CUDA By Example》【Chapter 06】常量内存与事件 ?
6.1 本章目标 高级些的功能,通过GPU上特殊的内存区域来加速应用程序的执行。其中一种内存区域:常量内存(Constant Memory)。介绍一种增强CUDA C应用程序性能的方法,了解如何通过事件来测量应用程序的性能。 如何在CUDA C中使用常量内存 了解常量内存的性能性能 学习使用CUDA事件来测量应用程序的性能 6.2 常量内存 由于GPU有很多ALU, 所以计算能力往...原创 2018-06-06 15:44:53 · 229 阅读 · 0 评论 -
《CUDA By Example》【Chapter 05】线程协作 ?
概述 本章介绍代码在各个并行副本之间的通信和协作。 1,了解不同线程之间的通信机制; 2,了解并行执行线程的同步机制; 5.2 并行线程块的分解 add<<<N,1>>>( dev_a, dev_b, dev_c); //第一个参数为想要启动的线程块数量; //第二个参数为CUDA运行时在每个线程块中创建的线程数量; //共创建了N个线程块,N*1...原创 2018-06-05 18:52:45 · 227 阅读 · 0 评论 -
《CUDA By Example》【Chapter 04】CUDA C 并行编程
GPU计算的应用前景在很大程度上取决于能否从很多问题中发掘出大规模并行性。 add_loop_cpu.cu #include &amp;amp;amp;quot;../common/book.h&amp;amp;amp;quot; #define N 10 void add( int *a, int *b, int *c ) { int tid = 0; // this is CPU zero, so we start at ze...原创 2018-06-04 18:47:15 · 232 阅读 · 0 评论 -
《CUDA By Example》【Chapter 03】CUDA C简介
3.2 第一个CUDA程序 simple_kernel.cu #include &amp;quot;../common/book.h&amp;quot; __global__ void kernel( void ) { } int main( void ) { kernel&amp;amp;lt;&amp;amp;lt;&amp;amp;lt;1,1&amp;amp;gt;&amp原创 2018-06-04 17:44:17 · 265 阅读 · 0 评论 -
GPU
GPU进阶之路 Training Video NVIDIA CUDA初级教程视频2014 周斌 NVDIA CUDA ZONE https://www.nvidia.cn/object/cuda_education_cn_old.html Book 《大规模并行处理器编程实践》 2010年9月 An Even Easier Introduction to CUDA ...原创 2018-05-14 17:43:20 · 222 阅读 · 0 评论 -
《CUDA By Example》【Chapter 11】多GPU系统上的CUDA C?
11.1 概述 了解如何分配和使用零拷贝内存(zero-copy memory) 了解如何在同一个应用程序中使用多个GPU 了解如何分配和使用可移动的固定内存(Portable pinned Memory) 11.2 零拷贝主机内存 固定内存(页锁定内存)能确保不会交换出物理内存。我们通过调用cudaHostAlloc()来分配这种内存,并且传递参数cudaHostAllocDefa...原创 2018-06-08 17:44:05 · 517 阅读 · 0 评论