开发环境
- WIN10
- CPU Q9550(不支持AVX、AVX2指令集)
- GTX950
*如果CPU支持AVX、AVX2指令集可以直接通过
pip install tensorflow
pip install tensorflow-gpu安装
若CPU不支持AVX、AVX2指令集无法直接通过pip install tensorflow安装,会报“动态链接库初始化例程失败”的错误,需要直接安装相应的已经编译好的gpu版本tensorflow。
已经编译好的tensorflow下载地址(根据其中的版本信息选择相应的CUDA、CUDNN版本,选择其中sse2版本)
https://github.com/fo40225/tensorflow-windows-wheel
CUDA下载地址
https://developer.nvidia.com/cuda-toolkit-archive
CUDNN下载地址(需要先注册)
https://developer.nvidia.com/rdp/cudnn-archive
显卡是否支持安装则需要根据
https://developer.nvidia.com/cuda-gpus
其中Compute Capability需要大于3.0
安装过程
一、安装VS2017
在vs2017安装选项中勾选C++和win10SDK
二、安装CUDA9.2
默认选项安装到底,如果安装失败,在安装过程中不要勾选Visual Studio Integration,安装过程中复制CUDA安装时解压的临时文件夹中
\CUDAVisualStudioIntegration\extras\visual_studio_integration\MSBuildExtensions 的四个文件到
C:\Program Files (x86)\Microsoft Visual Studio\2017\Community\Common7\IDE\VC\VCTargets\BuildCustomizations
安装完成后,再安装CUDA9.2的补丁文件
查看是否安装成功
在cmd中运行nvcc -V
三、安装CUDNN7.2.1
解压CUDNN的压缩文件,将对应文件复制到
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2
相应的文件夹下
四、安装tensorflow_gpu-1.10.0-cp36-cp36m-win_amd64.whl
在cmd中cd到相应的文件目录下运行
pip install tensorflow_gpu-1.10.0-cp36-cp36m-win_amd64.whl
安装完成后再到python中
import tensorflow as tf
如果没有报错则基本安装成功。
如果报ImportError:DLL load failed:找不到指定的模块则可能是python、VS、CUDA、CUDNN版本不匹配的问题。
参考资料
https://blog.csdn.net/weixin_39290638/article/details/80045236
https://blog.csdn.net/weixin_42359147/article/details/80622306
https://blog.csdn.net/Rex_WUST/article/details/84777603#commentBox
https://blog.csdn.net/wwtor/article/details/80603296
https://blog.csdn.net/weixin_38854519/article/details/81704133