CUDA
CUDA
王大队长
这个作者很懒,什么都没留下…
展开
-
bank conflict
因为尽管第一个 warp 的 0 号线程访问共享内存中 0 和 128 元素,这两个是同一 bank 的不同地址,但是这是一个线程发出的请求,只需要一次事务就能完成(个人理解),所以不会发生 bank conflict(需要不同线程访问统一 bank 的不同地址才会发生 bank conflict)。下面看一个特殊情况,一个线程存储 4 个浮点数,根据下图可以看到 0 号线程和 8 号线程在访问统一存储体的不同地址,按理是会发生 bank conflict 的,但是却没有。原创 2024-02-02 00:22:33 · 479 阅读 · 0 评论 -
CUDA tips
【代码】CUDA tips。原创 2024-01-17 00:14:08 · 465 阅读 · 0 评论 -
kaggle运行CUDA代码
参见:Running C++ in Notebooks(Cuda) | Kaggle转载 2023-04-04 17:38:41 · 271 阅读 · 0 评论