这几天一直在配置tensorflow-gpu版本,之前用的是tensorflow-cpu版本,训练过比较简单的mnist手写数字识别模型,也直接跑过别人训练好的openpose人体姿态识别模型,效率都比较低,既然想要继续学习计算机视觉这一块,最好是能用gpu,可以大大节省模型训练时间。这几天遇到不少坑,但当最终import tensorflow没有报错的时候,感觉踩得那些坑都不算什么。这个过程中参考了许多别人的经验和教程,现在自己再造轮子的原因是一方面想回顾下整个过程,理清思路,另一方面我遇到并解决的问题,别人可能没有遇到,所以放在这里也希望能帮助后人避开不必要的坑。
首先说明下我的环境:win7-64位系统+Nvidia GTX960显卡+python3.6.3。大家要注意自己的显卡要支持cuda, 可以到官网上查找
1. 显卡驱动安装。因为之前是没有独立显卡的,新装的独显,因此需要装驱动。不过也有人说装cuda的时候自带驱动,这个我没有验证。
http://www.nvidia.cn/download/driverResults.aspx/131469/cn
这个下载完之后直接安装即可。
2. 下载并安装cuda+cudnn。
注意,因为之前网上的很多教程都是cuda8.0的,而我直接下载安装了9.1版本,结果悲剧了。。。后来装的是9.0版本,经验证,cuda9.0+cudnn7.0是没有问题的。这里是第一个大坑,我开始的时候想最新的应该没有问题,后面当我import tensorflow的时候,提示