自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 问答 (3)
  • 收藏
  • 关注

原创 关于GL中uniform类型sampler系列变量的值的设定

Uniform类型中sampler系列变量值的设定。一些反复琢磨后得出的结论,继续下来。问题来源在GL官网中学习,发现设置诸如下面的变量在设置该值大小时,总是设置为零。shader.setInt("texture1", 0); //设置为零,是因为它是默认的激活纹理单元。但是如果我在同一个着色器中存在多个sampler2D的变量,那么此时都设置为零。会导致从只能从其中一个纹理获得纹理颜色,而不能都获得。解决办法将其中一个纹理绑定到其他纹理上,我这里将天空盒的纹理,绑定到第10个纹理

2022-02-09 17:58:39 2845

原创 GPUView 的安装和使用方法汇总(更新中)

下载链接:https://docs.microsoft.com/zh-cn/windows-hardware/get-started/adk-install下载需要根据自己系统的版本选择ADK版本。如何确定系统版本?选择ADK版本上述中,我的系统版本是win10 2004,因此选择下载点击下载,获得双击开始下载,有两种选择,一种是直接下载并安装。一种是下载可迁移的安装包。我选择第二种,获得安装包如下:图中压缩包是我备份的,可忽视。安装下载完成后,直接双击 adksetup.

2022-01-21 15:35:16 3861 3

原创 CUDA之Cooperative Groups操作,细粒度并行操作。

问题CUDA的线程执行单元是以warp来划分的,一个warp内部包含32个线程,这32个线程存在一个隐式的线程同步。而不同warp之间是不存在隐式同步的。在一个block中,往往存在多个warp,倘若在程序中使用同步机制"__syncthreads()"令线程同步,此时可能会发生条件竞争的问题。导致指令延迟过高,性能变低,如下所示。__global__ void test(){ const int idx = threadIdx.x + blockIdx.x * blockDim.x; if (i

2021-12-13 16:40:20 2631

原创 CUDA配置:The CUDA Toolkit directory ‘‘ does not exist.问题解决方法

要将CUDA单独拿出来配置CUDA工程时出现这样的问题。The CUDA Toolkit directory ‘’ does not exist. Please verify the CUDA Toolkit is installed properly or define the CudaToolkitDir property to resolve this error.如下文件中,打开找到 Microsoft.Cpp.props,下面位置添加上图红框内容,具体名称和路径按照需要自行设置

2021-12-03 14:03:18 4865

原创 CUDA优化之隐藏GPU预热时间

在CUDA实际开发中,CUDA中API启动之前,存在隐藏的上下文初始化时间,这也是为什么在nvvp中查看时间线,发现第一个cudaMalloc时长200ms左右的原因。这部分时间有时候相对于核函数运行时间较长,但又不能不预热GPU。在大多数的CUDA示例中,都是先给主机端数据分配空间和初始化,再给设备端分配空间和数据传输。此时预热时间和主机端初始化时间是串行的。 int* a = new int[N]; int* b = new int[N]; for (size_t i = 0; i <

2021-11-25 18:08:26 1224

原创 VS2013的CUDA开发中无法识别.cuh出现MSB3721错误

因为特殊原因,需要使用VS2013进行CUDA开发。为了方便,我一般将CUDA程序的声明和定义分别放在**.cuh和.cu**文件中,但是在VS2013上在将环境配置好之后,加入头文件test.cuh,出现MSB3721的问题,即链接的问题搜了很多资料,也自己去查看过链接,但仍然不知所措。查看命令行代码,即上图中下面的大红框内容。有一个命令是 -o *\test.cuh 。我记得在linux开发时,对CUDA代码编译生成时,应该只 -o *.cpp 和*.cu。而不对**.cuh**进行编译生成。

2021-11-18 14:13:46 1099

原创 VS 中生成CUDA依赖项的生成自定义文件的相对路径设置

问题如下图红框所示:想要下面所示的路径但是查找现有的文件,只能得到绝对路径。解决办法如下所示:找到工程路径下的.vcxproj文件(不是.vcxproj.filters,也不是.vcxproj.user),打开进行如下设置这样项目拷贝到其他电脑也可以照常使用。...

2021-11-17 17:15:53 539

原创 如何查看CUDA的内存对齐要求?

先保留部分内容,后续休息下完善。先说如何查看CUDA的内存对齐要求?// Host code 二维分配数据 int width = 1, height = 600; float* devPtr; size_t pitch; cudaMallocPitch(&devPtr, &pitch, width * sizeof(float), height);在width =1的时候,pitch = 512;pitch以字节(Byte)为单位。可以测试在width=128的时候

2021-10-25 16:31:24 606 1

转载 OpenCL错误码和说明

OpenCL错误码和说明#define CL_SUCCESS 0 命令成功执行,没有出现错误#define CL_DEVICE_NOT_FOUND -1 未发现与条件匹配的OpenCL设备#define CL_DEVICE_NOT_AVAILABLE -2 OpenCL设备目前不可用#define CL_COMPILER_NOT_AVAILA

2021-07-08 16:44:29 4264

原创 Word,PPT 中去除mathtype

手机码字先随便点儿,后期改卸载mathtype 或者不想要他的加载项方法csdn 中一堆其中关于ppt 中从注册表中找不到需要换个地方HKEY_LOCAL_MACHINE >software >Wow 6432Node >Microsoft >office >(各个版本的都打开,如14.0)>powerpoint >addins 中的mathtype 文件全部删除可能会有地址不同的情况,这时候用Ctrl +F 搜索MathType 搜到与上述地址相关的,

2021-01-25 15:25:19 5654 1

原创 win10平台下双GPU内双异步流代码开发框架分享

前言:为了处理大批量数据,项目需要高并行处理,快速完成计算。开发平台为两台服务器,每台服务器拥有8个V100 GPU。本人目前使用工作站只有两个GPU(RTX 3080)。直接上代码,注释也比较清楚,有CUDA代码开发经验的能直接读懂,多GPU开发使用还不熟练,代码效率感觉不高,有哪里可以改进的,希望有心之人可以指出,每一次交流都是一次进步!1.平台介绍win10 + VS2015 + CUDA11.0 + RXT3080*22.代码//多GPU编程,现在还不熟悉使用,有些函数不熟悉。#inclu

2020-12-18 17:43:00 252 1

原创 win10平台下VS中CUDA的Nsight_VS_ Edition工具的安装以及问题

前言:最近配置了GPU工作站,用CUDA开发一个多服务器多GPU的某信号处理加速程序。在开发程序的过程中想要进入每个kernel进行调试。之前在笔记本(win7+Geforce840M+VS2015+CUDA9.2)上安装好,可以直接在VS中使用菜单栏中Nsight(Legacy)中的工具进行调试。但在这个工作站(win10+RTX 3080*2+VS2015+CUDA11.0),由于Nsight Monitor一直无法连接到该主机,无法进入kernel进行调试(网上各大教程已查阅),在NVIDIA官网看到

2020-12-14 15:45:23 4683 5

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除