错误
事实告诉我们,有些坑必须自己走
顺序所需我们都懂:cuda、cudnn、python(anaconda)、tensorflow,但是
坑 1:python:报错encording,
不知什么时候手欠删除了pythonhome,可加上之后,对anaconda中不同python版本,pycharm选择不了(就pythonhome仍保存,只是路径随便设了一个),第一个问题解决了
坑2:不要用anaconda中的tensorflow包,只到1.8.0,不能自动对应版本
我简直是栽在这个坑上了。在我后面有的网络没有跑通,一直报cudnn,新手的我,简直mmp,因为想着它不对应我的cuda、cudnn,而且anaconda里怎么又cuda,简直一个头两个大。其实anaconda里面tesorflow1.8下载的时候,自己下载配置了相关的cuda9,及cudnn,所以相当于自己集成了一个环境,也是可用的,不过有点老(参考博客1)
环境变量:
坑3:版本一定要对应
最后我装了python3.69+tensorflow1.14.0+cuda10.0+cudnn7.6
(这个图估计比较老,新版tesorflow10.1也可用,但是cuda不要超过nvdia控制面板里面的组件cuda.dll对应的,气死我了,因为cuda10.0当时死活下不下来,我用了最新10.1.几,反正超过了我那个10.1几,就报错里,又又卸载下来重配了cudnn、cuda)
环境变量:
这里主要用到前三个变量,后面的是cuda例子,测试cuda
也可以直接写入path(写的比较全,以防有问题,其实主要是目录、bin、lib)
坑4 .下载太慢用镜像
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.13.1
或者去python给出的网站https://www.lfd.uci.edu/~gohlke/pythonlibs下载轮子,pip install 包位置,这种情况下用其自带的prompt中安装,方法仍然pip(不要用cmd下,容易引起混乱)
坑5.报numpy相关错误或着警告
1、相关错误警告,百度,最后安装了numpy-mkl,并upgrade最新解决了。千万不要删除再安装,因为tensorflow会安装相关包,我之前想着就是先卸载再安,结果各种错误不断,这是因为numpy、sci、pillow有依赖关系。(不行的话就卸载tensorflow重安或者换个Python版本)
2、警告
感觉不好看,就百度一下解决,说卸载numpy再安装,结果就上面问题,…
坑6 cudnn initialize失败、不能created
有时候不是环境的问题,可惜小白一直怀疑,其实我也怀疑是gpu,可是网上代码一直没解决,今天在ssd代码看到这个,才能用,加上:
内存不够
终于环境好了,可以安心学习,不再怀疑环境上了。