cuda学习
文章平均质量分 84
网安菜13
这个作者很懒,什么都没留下…
展开
-
CUDA学习之第五章 共享内存和常量内存(二)
由于第一种访问方式邻近的线程会访问连续的地址,所以一个线程束内不会冲突存储体,所以他是比较好的方式。原创 2023-08-10 18:42:29 · 82 阅读 · 1 评论 -
CUDA学习之第五章 共享内存和常量内存(一)
全局内存就是较大的板载内存,而共享内存则是较小的片上内存。原创 2023-08-04 10:47:58 · 226 阅读 · 1 评论 -
CUDA学习之第四章:全局内存(四)
理论带宽是指能达到的绝对最大带宽,有效带宽是核函数实际达到的带宽,计算方法是:有效带宽(GB/s) = (读字节数+写字节数)× 10^-9 / 执行时间。原创 2023-07-29 15:06:12 · 76 阅读 · 0 评论 -
CUDA学习之第四章:全局内存(三)
全局内存通过缓存来实现加载和存储(二级缓存),核函数的内存请求通常是在DRAM设备和片上内存间以128字节或32字节内存事务来实现。所有对全局内存的访问都会通过二级缓存,也有许多会通过一级缓存,。可以在编译时选择禁用或启用一级缓存。一行一级缓存是128字节,它映射到设备内存中一个128字节的对齐段,如果线程束的每个线程请求4个字节,那么每次就会请求128字节,正好与缓存行和设备内存段的大小相契合。和。当设备内存事务的时,会出现对齐内存访问,运行非对齐的加载会浪费带宽。原创 2023-07-28 16:03:32 · 169 阅读 · 1 评论 -
CUDA学习之第四章:全局内存(二)
分配了count字节的全局内存给devPtr指向的地址。分配和释放的成本很高,应该多次利用内存少开新的。原创 2023-07-28 10:40:07 · 103 阅读 · 1 评论 -
CUDA学习之第四章:全局内存(一)
就是个图,总结了一下,跳过了。原创 2023-07-27 16:42:20 · 155 阅读 · 1 评论