CUDA
weareu
这个作者很懒,什么都没留下…
展开
-
tensorflow迁移错误
首先在Nsight Monitor中关闭tdr 然后nsight\host\commen中找到DisableWpfHardwareAcceleration. reg,并运行原创 2020-11-07 20:07:15 · 152 阅读 · 0 评论 -
CUDA与Tensorflow 联调
一、err_num 33 invalid resource handle 问题:从单GPU卡过渡到双GPU卡的时候出现 解决:参考该网页https://devtalk.nvidia.com/default/topic/496605/cudasafecall-runtime-api-error-33-invalid-resource-handle-/ 分析:流必须在设置设备后建立,但是本问题也无法解...原创 2019-11-09 00:28:52 · 391 阅读 · 0 评论 -
MFC调用CUDA代码
反正就是要使用MFC的界面, VS2015+CUDA9.2 步骤如下: 首先将整个项目调整为使用NVCC编译:右键,生成自定义,选择NVCC即可。 一、工程下建立筛选器 右键,添加,新建筛选器 二、将所有的cuda代码添加到筛选器中 三、在筛选器中建立一个cuda文件,该文件导出一个函数,调用cuda代码,注意,该文件中的全局变量不具备全局变量的功能,如下所示,全局变量的值不但无法导出,而且退出函...原创 2019-05-27 00:34:28 · 866 阅读 · 0 评论 -
cuda 编程
C语言扩展 函数执行空间描述符 定义函数执行位置和调用位置。 描述符__device__ 设备执行,且仅设备调用,不能与描述符__global__同时使用 描述符__global__ 设备执行,主机调用,3.2后的设备可调用 ,返回void,不能是类成员 描述符__host__ 主机执行,仅主机调用,不能与__global__同时使用,但可与__device__同时使用,代表…… ...翻译 2018-12-09 21:19:25 · 212 阅读 · 0 评论 -
cuda 优化
一、指令优化 (一)代数指令 1、除法跟模运算尽量少用,可能的话替换为比特级操作 2、平方根倒数 rsqrt,rcbrt 3、其他指令:避免双精度到单精度的自动转换。 4、小分数的指数运算使用2中的组合 5、数学库:使用快速的数学库(__sin)和专用的函数(exp2(),exp10(),sinpi()) -use_fast_math选项将普通函数转换为快速库函数 ...翻译 2018-12-07 00:18:00 · 549 阅读 · 0 评论 -
NVCC
-arth, --gpu-arthitecture 定义用于编译的虚拟架构 描述编译CUDA输入文件的NVIDIA虚拟GPU架构类别。排除速写的情况,该选项描述的架构必须是虚拟架构(例如,compute_50)。通常,单独的该选项并不会触发产生的PTX在真实的架构上进行汇编,它的目的是控制预处理和输入到PTX的编译。 在简单NVCC编译的情况下,支持速写:如...翻译 2018-12-06 23:49:25 · 1748 阅读 · 0 评论 -
cudaMallocManaged
该函数分配的内存,所有设备与主机均可访问(与统一内存管理有关); 核函数调用之后必须调用下列函数等待设备完成访问,CPU才能进行访问; cudaDeviceSynchronize() CUDA8.0,SM6.x之后,使用cudaMalloc默认使用同一内存管理。 注:windows,mac Os 目前只支持基本的统一内存管理属性,不支持SM6.x之后的统一内存管理属性。 可以使用cuda...原创 2018-05-03 22:07:34 · 9343 阅读 · 0 评论 -
关于常量内存
无法写入常量内存。按照例子可以搞定,但是当在C++类中使用常量内存时,怎么都写不进去,奇怪得很。声明:__constant__ int iTemp[4];赋值:int iHost[4] ={0, 1, 2, 3}cudaMemcpyToSymbol(iTemp, iHost, sizeof(int)*4);...原创 2018-05-01 20:15:11 · 369 阅读 · 0 评论 -
CUDA 问题合集
一、核函数无故退出: 可能是由于传入的参数存储于主机内存中核函数访问不到,或者数组越界等原因。 例如: 1、传入了存储于主机的结构体,无论是结构体指针还是引用; 传入结构体引用时,调试的时候可能发现传入的结构体内容不正常,但是运算时却没有问题 。 2、传入了主机内存的指针。 可以在调试的时候进入反汇编发现该问题。 注意: 传入参数为基本类型时,不牵扯存储于主机的问题。 二、...原创 2018-05-01 20:12:22 · 657 阅读 · 0 评论