c语言编译 gpu,Windows下编译tensorflow-gpu教程

最新推荐文章于 2023-04-13 18:12:52 发布

孙将帼

最新推荐文章于 2023-04-13 18:12:52 发布

阅读量346

点赞数

文章标签： c语言编译 gpu

首先是系统配置：OS：Windows Server 2012 R2(相当于Windows 8)

GPU：NVIDIA Quadro K1200

然后是各种软件版本：git 2.14

Visual Studio 2015

CUDA 8.0.61

cuDNN 6.0

Anaconda3-4.2.0(此版本非最新版本，之所以使用是因为其默认python版本为3.5.2)

cmake 3.9.1

swig 3.0.12

一、安装CUDA

0. 首先需要在cuda-gpus检查电脑的GPU是否支持cuda编程，要求Compute Capability 3.0及以上。

1. 安装Visual Studio 2015(需要在CUDA之前安装好)

2. 安装CUDA toolkit 8.0(推荐下载离线版本)

bin、include、lib

二、安装tensorflow-gpu

1. 安装anaconda

2. 进入python3.5环境，通过以下命令安装tensorflow-gpu:

pip install --ignore-installed --upgrade tensorflow-gpu

3. 如果遇到各种lib、dll缺失的问题，可以尝试通过添加对应的路径到path中来解决在CUDA_PATH后面添加bin和lib\x64路径

将cudnn64_7改为cudnn64_6

4. 测试代码

如下：#Creates a graph. a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a') b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b') c = tf.matmul(a, b) #Creates a session with log_device_placement set to True. sess = tf.Session(config=tf.ConfigProto(log_device_placement=True)) #Runs the op. print sess.run(c)

三、编译tensorflow-gpu

一些说明：使用pip或anaconda等方式安装的预编译好的tensorflow没有AVX2指令集加速，通过手动编译可以更好的利用GPU。但是如果没有AVX或者GPU的话，手动编译几乎没有优势。

官方只提供了Ubuntu和Mac OS X的编译支持，在Windows下可以通过Bazel和CMake两种方式进行编译，但只是 “highly experimental”，可能会遇到各种错误。下面使用CMake来进行编译。

0. 进行编译之前安装一下软件：Cmake 3.5以上

Git

swig

Windows下的额外要求：Visual Studio 2015

Python 3.5

Numpy 1.11.0 or later

1. 设置环境变量C:\Program Files (x86)\Microsoft Visual Studio version\VC\vcvarsall amd64，从64位命令行编译到64位的目标平台。执行这一步可以避免编译的时候出现内存不足的错误。

NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin

cudnn-8.0-windows7-x64-v7\cuda\bin

CMake\bin

2. 下载 Tensorflow源代码tensorflow\tensorflow\contrib\cmakebuildD:\temp> git clone https://github.com/tensorflow/tensorflow.git D:\temp> cd tensorflow\tensorflow\contrib\cmake D:\temp\tensorflow\tensorflow\contrib\cmake> mkdir build D:\temp\tensorflow\tensorflow\contrib\cmake> cd build D:\temp\tensorflow\tensorflow\contrib\cmake\build>

3. 调用cmake来产生Visual Studio solution 和project files.D:\...\build> cmake .. -A x64 -DCMAKE_BUILD_TYPE=Release ^ More? -DSWIG_EXECUTABLE=C:/tools/swigwin-3.0.10/swig.exe ^ More? -DPYTHON_EXECUTABLE=C:/Users/%USERNAME%/AppData/Local/Continuum/Anaconda3/python.exe ^ More? -DPYTHON_LIBRARIES=C:/Users/%USERNAME%/AppData/Local/Continuum/Anaconda3/libs/python35.lib

如果有NVIDIA显卡，且安装好了cuDNN,那么可以添加以下参数：More? -Dtensorflow_ENABLE_GPU=ON ^ More? -DCUDNN_HOME="D:\...\cudnn"

4. 调用MSBiuld来编译Tensorflow

使用以下命令产生.whl文件D:\...\build> MSBuild /p:Configuration=Release tf_python_build_pip_package.vcxproj

遇到的问题：打开对应的文件发现出现了乱码，google之后发现可以通过修改locale为英语(美国) 来解决。

nslookupgithub.global.ssl.fastly.net,storage.googleapis.comipconfig /flushdns。当然也可以尝试手动下载到对应的目录。

孙将帼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
c语言编译 gpu,Windows下编译tensorflow-gpu教程

首先是系统配置：OS：Windows Server 2012 R2(相当于Windows 8)GPU：NVIDIA Quadro K1200然后是各种软件版本：git 2.14Visual Studio 2015CUDA 8.0.61cuDNN 6.0Anaconda3-4.2.0(此版本非最新版本，之所以使用是因为其默认python版本为3.5.2)cmake 3.9.1swig 3.0.12一...
复制链接

扫一扫