cuda
Lord_Rebel
程序员新兵~
展开
-
c++ cuda 混合编程的坑
今天复习cuda的时候发现忘了如何混合编程,在这里记录下,有两种方法: 之前别忘了在生成自定义中选上 cuda 1.把 cuda相关的函数放在 .cu 文件里并且需要在 c++中调用的函数要用extern 声明。 2.(我以前采用的方法).cu 文件属性 选择 cuda c++,然后在生成依赖项中加入: cublas_device.lib cublas.lib cudart.lib 然后...原创 2020-04-21 08:41:40 · 665 阅读 · 0 评论 -
《cuda并行程序设计》勘误(3)
180页 __host__ TIMER_T sort_to_bin_cpu 函数,形参bin_count 多余。 182页 __host__ TIMER_T sort_bins_gpu函数,形参bin_count 多余。 183页__host__ TIMER_T sort_bins_gpu_kernel3函数,形参bin_count 多余。原创 2017-03-08 19:35:14 · 330 阅读 · 0 评论 -
《cuda并行程序设计》勘误(1)
好久没更博客了。 最近在学cuda c/c++,正在看一本叫做《cuda并行程序设计》的书,在京东上买的(应该不是盗版吧)风评不错。但是我这么一看啊....发现代码的错误简直就是遍地都是.....然后我给cudabook@gmail.com发邮件,也不知道是没空理我还是这个邮箱已经荒废了...没人理我。所以呢,我决定把目前发现的错误发出来,以免耽误其他人的学习。 就是这本书。原创 2017-02-26 10:53:06 · 785 阅读 · 2 评论 -
《cuda并行程序设计》勘误(2)
注:本人代码是对长度为1024的数组排序; block数量为1,threads数量为256 p135页代码应改为: __device__ void merge_array(u32 *src,u32 *dest,u32 num_lists,u32 num_elements,u32 tid){ u32 reduction_shift=3; u32 reduction_size=8; u32原创 2017-02-27 11:08:00 · 348 阅读 · 0 评论