自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 关于nvprof的一些操作

运行nvprof:nvprof ./a.out但是结果是:NMF: Non-negative Matrix FactorizationOptions:Parameters for training: -train <file> Use data from <file> to train the model; ...

2019-08-13 11:19:22 4419

原创 CUDA xshell调试指令

生成cubin二进制文件nvcc -arch=sm_35 a.cu -cubin生成a可执行文件nvcc -arch=sm_35 a.cu -o a生成a.png指令流程图nvdisasm -cfg a.cubin | dot -Tpng -o a.png

2019-07-09 14:58:54 706

原创 CUDA-GDB 调试指令

打印全局内存:p ((@global float*)in)[0]@128查看所有线程状态:info cuda threads

2020-08-22 08:25:42 472

原创 vscode 远程连接问题汇总

VScode每次更新完,远程连接总是出错。提示的错误各种各样。试了很多方法,更改remote ssh的版本的方法最有效。(如果你之前远程连接一直好使,突然不好使了,那就试试这个方法)目前使用0.48版本。网上很多人说0.49版有效,可能存在些差异吧,不晓得为啥。方法: 在extension里,查找 remote ssh。然后在这个应用右下角的设置里找到安装其他版本。挨个儿试吧!...

2020-04-12 05:54:47 3887 2

原创 kernel函数进不来?device信息不对?

加cudaDeviceReset();函数!!!!!

2019-11-20 03:33:32 217

原创 关于eclips的一些使用

erro1: The program file specified in the launch configuration does not existhttps://stackoverflow.com/questions/13690644/the-program-file-specified-in-the-launch-configuration-does-not-exist

2019-11-19 23:55:36 132

原创 CUDA Nsight Debug No source available for "main()

No source available for "main():刚开始查的是C/C++之类的问题,改了makefile的一些参数,还是不好使,突然看到这位小哥的解决方法,开朗!https://github.com/RustDT/RustDT/issues/50总结:在debug-> Debug Configurations-> Debugger(Tab)下uncheck “Sto...

2019-10-17 05:17:18 834

原创 计算访存比

https://blog.csdn.net/king_lu/article/details/54021280分析算法的计算访存比加减乘除都算一次操作(连续的乘加操作算一次);单次访存算一次操作(如果会用到非连续数据,那么要按cacheline长度算,因为机器实际会按照cache line读取数据);https://a1exwang.com/untitled-2/...

2019-10-17 05:12:00 2506

转载 解决Stripping trailing CRs from patch

patch -t -N -p0 srad_kernel.cu -i srad_v2-out-of-bounds.patch(Stripping trailing CRs from patch; use --binary to disable.)patching file srad_kernel.cuHunk #1 FAILED at 42 (different line endings)....

2019-10-16 05:43:37 4982

原创 理解CNN卷积计算

为什么要加padding:解决两个问题:1. 输出缩小。比如当你有100层深层的网络,如果图像每经过一层都缩小的话,经过100层网络后 ,你就会得到一个很小的图像。2. 图像边缘的大部分信息都丢失了。什么是padding.在图像边缘填充一圈像素。公式为:输入:n(原图像像素nn)f(卷积核的大小ff),p(填充的像素个数)输出:(n+2p-f+1)*(n+2p-f+1)如果想让...

2019-08-27 14:44:36 173

原创 从字符串中提取整数

部分整理自:https://blog.csdn.net/liangxanhai/article/details/8026496首先说一下我要做的事情:从一个txt文件中(存着一个矩阵),从这个文件中提取出这个文件中的整数。矩阵:1 2 3 45 6 7 80 1 8 73 8 2 9之前用的函数是fgets()。char * fgets(char * s, int n,FILE...

2019-08-15 17:38:46 5581

原创 如何了解GPU汇编指令?

问题:如何将CUDA源码和其汇编指令对应上?答案:先写一个简单且正确的框架,对照着汇编指令的意思去解析。方法:不要害怕。你了解的那些指令都是对的。...

2019-07-07 20:13:00 2640 2

翻译 CUDA C编程指南 第五章 在多处理器级别使使用率最大化

多处理器级别隐藏L个时钟周期延迟所​​需的指令数取决于这些指令的相应吞吐量(有关各种算术指令的吞吐量,请参见第5.4.1节);假设所有指令的最大吞吐量,它是:1.x计算能力的设备, 一个多处理器一个warp在4个时钟周期内发射一条指令到一个warp需要L/4 个延迟周期。2.0计算能力的设备, 一个多处理器一个warp在2个时钟周期内发射一条指令到两个warp需要L 个延迟周期。2....

2019-06-10 09:48:07 193

翻译 CUDA C编程指南笔记——第四章(一个线程块中的warp和寄存器数量计算公式)

第四章 硬件映射SIMT(Single-Instruction, Multiple-Thread)SIMT指令指定单个线程的执行和分支行为,如果仅仅想要编程正确的话,程序员不用理会SIMT,然而需要注意在代码中减少warp中线程的分支分歧。但是如果你想写出peak性能的话,则需要考虑了。向量架构需要软件层面上进行合并访存到向量,以及手动的调整分支分歧。如果non-atomic指令通过不止一...

2019-06-06 16:33:19 1032

原创 Visual Studio 2017 无法启动程序,系统找不到指定文件

【视图】–&gt; 【属性窗口】然后在【包括在项目中】选择False,再次编译,完成!!

2019-03-10 21:43:42 15888 4

原创 variable "d_in" is used before its value is set

lesson_1.cu(26): warning: variable “d_in” is used before its value is set设置初始值:d_in = 0即可以。

2019-03-10 21:26:05 2982

原创 安装visual studio 2017 + Cuda配置

之前手欠,删了CUDA的所有子程序,然后再安装就安不上了,经过大神教程,第一次安装的时候没有安装visual插件,然后就安装通过了,但是在编译CUDA Samples的时候,出现以下错误:错误 CMake Error at D:\Program Files (x86)\AppData\cuda10.1\nvvm\libnvvm-samples\CMakeLists.txt:158 (messa...

2019-03-10 21:24:34 3225

原创 安装NIVIDIA CUDA toolkit

出现 此NIVIDIA驱动与Windows版本不兼容 的问题:查阅资料显示,需要更新系统至最新版本。我的方法:下载最新版本的toolkit,即toolkit10.1(目前的系统是win10),安装成功。出现问题的原因:迷之相信网上的各种教程和攻略,害怕出现软件之间不兼容的现象,下载toolkit8.1,然后死脑筋的只更新系统。事实说明,反正时间都花这么多了,不妨胆儿大点犯个错试试。哼哼...

2019-02-27 23:27:58 806

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除