WINDOWS 下编译CUDA的好方法

原创 2016年08月29日 12:50:09
首先要确定VS和NVDIA的套件都装好了。
在VS里面设置各种烦。

首先把main.cpp 和maxwell.cu 文件放到一个文件夹下。也不需要建立啥工程。
然后用下面的工具


WINDOWS <wbr>下编译CUDA的好方法

如果是两个文件,一个是test.cu,另一个是main.cpp
则cpp里面无需include "test.cu".

nvcc -arch=sm_52 -c test.cu
会生成test.o
然后
nvcc -arch=sm_52 main.cpp test.o
就会生成a.out了




如果是程序里面用了sprintf之类调用kernel,生成cubin或者ptx 的话
打开后,cd到该目录下
nvcc -arch=sm_52 --cl-version 2010 --ptxas-options=-v --machine 64 -cubin -o maxwell.cubin maxwell.cu
或者
nvcc -arch=sm_52 --cl-version 2010 --ptxas-options=-v --machine 64 -ptx -o maxwell.ptx maxwell.cu

生成ptx 或者cubin


然后
WINDOWS <wbr>下编译CUDA的好方法

nvcc main.cpp -lcuda -lcudart
自动生成 a.exe文件 (这里也可以-o 指定输出文件名)

然后.\a.exe就可以生成了。


WINDOWS <wbr>下编译CUDA的好方法

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

windows10+cuda8.0+cudnn5.1+vs2013下编译caffe

下载caffe 解压 修改配置文件 编译 ERROR下载caffe既然在windows下,给点面子下载微软版本的 caffe 解压解压到当前文件夹 修改配置文件进windows 改名CommonS...

UITableView&nbsp;reloadData的正确方法

相信很多人会遇到这种情况,当tableView正在滚动的时候,如果reloadData,偶尔发生App crash的情况。 这种情况有时候有,有时候没有,已经难倒了很多人。直至今天,我在stackov...

【caffe】windows下caffe+vs2013+python2.7+cuda8.0+cmake3.8编译与配置

项目的需要,终究还是用到了深度学习,Caffe无疑是我这种菜鸟最好的入门平台,然鹅,事情并没有想象的那么简单!!!单是编译caffe的库就已经把我折腾得灰头土脸了,搜了很多caffe的编译教程,一步一...

windows7+visual studio 2013+CUDA7.5 编译caffe+配置matcaffe+配置pycaffe

经过朋友指导,终于成功在windows7上成功编译了caffe,这里将编译过程记录安装文件准备 1 visual studio 2013安装包下载 2 CUDA75 optional 3 window...

关于ios object-c 类别-分类 category 的静态方法与私有变量,协议 protocol&nbsp

转自: 作者:舍得333 主页:http://blog.sina.com.cn/u/1509658847 版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出版、作者信息和本声明,...

iOS&nbsp;添加自定义字体方法详解

1.获得字体文件 (1)从网络下载,如百度等。格式为 .ttf或.otf (2)从Mac电脑上获取。在Macintosh HD中资源库的Fonts文件中。如图 添加自定义字体方法详解" TITLE=...

windows+caffe+cuda8.0+cudnn5.1+gtx1080ti cudnn编译时opencv编译出错,找不到指定文件。

问题描述:     在VS2013上编译caffe,在CPU模式下能顺利通过,但是在编译Cudnn时一直报错,且都是同一个错误。     S:\NugetPackages\OpenCV.2.4.1...

windows10下编译SSD cuda8.0 失败,cpuonly成功

最近又尝试了在windows10下编译SSD,无奈出现了很多错误。 参考网址:https://github.com/conner99/caffe 首先是需要VS2013,由于我是装了VS2015,所以...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)