新购置一台机器,专用于机器学习(酷睿i7,NVIDIA GeForce GTX 1080ti),按原来计划在docker中跑任务,经过尝试有一定难度,留后续攻克。
先在win10环境中把tensorflow-gpu搭建,先在把设计的模型跑起来,毕竟比赛已经没有剩几天了(虽然这个比赛我还只能打酱油,也要全力以赴呀)。
安装过程参考《Win10环境+ CUDA9.0 +CUDNN7.0+TensorFlow1.7/1.6/1.5配置》,根据步骤运行没有太大问题,仅遇到了3个小问题:
1、运行cuda_9.0.176_win10.exe,按默认选择“精简”安装时,报错:找不到 Visual Studio安装目录。
解决:本机器是新购置的,的确没有安装Visual Studio(目前我也不需要),所以安装我选择“自定义安装”,把Visual Studio Integration勾选去掉。
2、通过pip install tensorflow-gpu --user 成功运行后,进入python环境,运行 import tensorflow as tf,报错:找不到dll依赖包
经过诊断发现,目前(2018年10月18日)pip install tensorflow-gpu --user 安装的tensorflow-gpu版本为1.11,而cuda的9.0版本与之不兼容,把tensorflow-gpu版本降为1.7 就OK,运行:pip install tensorflow-gpu==1.7 --user
3、忘了是哪一步出错了,由于未安装Micosoft Visual C++ 2015 Redistributable Update 3 ,在网站https://www.microsoft.com/zh-cn/download/confirmation.aspx?id=53587 下载安装即可。