![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
文章平均质量分 84
莫翰轩 MoDonald
莫寒酸MoDonald
展开
-
分别用 mpi 和 cuda 实现圆周率 pi 的 Lebniz级数计算
圆周率计算,并行加速,mpi, cuda, gpu,双精度浮点数,reduce sum 规约,大数吃小数的精度问题处理方法,等等原创 2022-03-14 22:13:17 · 1261 阅读 · 0 评论 -
shared memory 优化 gpu 的 归并排序 merge sort
cuda gpu 归并排序的并行加速,使用 shared memory 共享内存进行优化,线程同步,__syncthreads(),规约reduce, 双调排序 bitonic sort原创 2022-03-08 01:18:48 · 1721 阅读 · 0 评论 -
CUDA kernel函数不执行、不报错的问题
CUDA 核函数不执行、不报错的问题最近使用CUDA的时候发现了一个问题,有时候kernel核函数既不执行也不报错。而且程序有时候可以跑,而且结果正确;有时候却不执行,且不报错,最后得到错误的结果。这种情况一般是因为显存访问错误导致的。我发现如果有别的程序同时占用着GPU在跑的时候,且占用的显存非常大的时候,我再执行一个CUDA程序 (比如我另一篇博客写的归并排序的CUDA加速) 时,kernel函数就会不执行而导致结果错误,但是如果调用一张空闲GPU卡就能跑出正确结果。解决方案:为了解决不报错的问原创 2022-02-08 17:00:47 · 6530 阅读 · 4 评论 -
CUDA 归并排序 的GPU加速
CUDA实现归并排序的GPU加速,merge sort,分治,并行,c++原创 2022-02-02 22:19:09 · 3010 阅读 · 2 评论