cuda
Lord_Rebel
程序员新兵~
展开
-
c++ cuda 混合编程的坑
今天复习cuda的时候发现忘了如何混合编程,在这里记录下,有两种方法:之前别忘了在生成自定义中选上 cuda1.把 cuda相关的函数放在 .cu 文件里并且需要在 c++中调用的函数要用extern 声明。2.(我以前采用的方法).cu 文件属性 选择 cuda c++,然后在生成依赖项中加入:cublas_device.libcublas.libcudart.lib然后...原创 2020-04-21 08:41:40 · 685 阅读 · 0 评论 -
《cuda并行程序设计》勘误(3)
180页 __host__ TIMER_T sort_to_bin_cpu 函数,形参bin_count 多余。182页 __host__ TIMER_T sort_bins_gpu函数,形参bin_count 多余。183页__host__ TIMER_T sort_bins_gpu_kernel3函数,形参bin_count 多余。原创 2017-03-08 19:35:14 · 338 阅读 · 0 评论 -
《cuda并行程序设计》勘误(1)
好久没更博客了。最近在学cuda c/c++,正在看一本叫做《cuda并行程序设计》的书,在京东上买的(应该不是盗版吧)风评不错。但是我这么一看啊....发现代码的错误简直就是遍地都是.....然后我给cudabook@gmail.com发邮件,也不知道是没空理我还是这个邮箱已经荒废了...没人理我。所以呢,我决定把目前发现的错误发出来,以免耽误其他人的学习。就是这本书。原创 2017-02-26 10:53:06 · 793 阅读 · 2 评论 -
《cuda并行程序设计》勘误(2)
注:本人代码是对长度为1024的数组排序; block数量为1,threads数量为256p135页代码应改为:__device__ void merge_array(u32 *src,u32 *dest,u32 num_lists,u32 num_elements,u32 tid){ u32 reduction_shift=3; u32 reduction_size=8; u32原创 2017-02-27 11:08:00 · 356 阅读 · 0 评论