故事背景:
本研究僧为了秋招卷大厂放弃了半年的深度学习,重回Python的一些坑记录。
其实最后也没有去大厂,感觉自己还是想要WLB,>.<。
问题与解决:
1:版本问题
想用GPU加速深度学习的训练一定不能同时下载tensorflow和tensorflow-gpu。
如果遇到了什么tensorflow找不到的bug,请直接删除所有带有tensorflow的包,然后找到对应版本的下载
对应版本是指CUDNN和CUDA以及你自身显卡实力对应的tensorflow-gpu版本。
2.CUDA和CUDNN下载(2、4一起看食用体验更佳!)
CUDA下载比较简单
CUDNN的话。。
如果清华源镜像有资源的话可以直接下载源镜像,如果没有可以CSDN一个文章采用复制链接的方法来使用迅雷这样的下载软件下载。
因为英伟达官网注册登录真的很麻烦啊!而且访问速度堪忧。又不是像git这样常用的网站,我就没有改host地址。干脆使用了楼上两个方法。
CUDNN镜像
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/
3.CUDA和CUDNN卸载
卸载CUDA和CUDNN就是卸载四个CUDA相关,因为CUDNN是内嵌在CUDA包里面的,会自动调用CUDNN。
接下来就是卸载啦。
打开控制面板卸载还挺快的,记得看清楚就这四个,不要害怕更不要手抖!
请直接卸载。
如果你电脑有杀毒软件,也可以把注册表删除掉。(这年头谁还没个杀毒软件了)
如果你是强迫症患者,还可以把上图这个也删了反正重新安装也会提示你重名是否替换,不如现在就删掉!
检查自己是否卸载成功的方法就是CMD nvcc -V,同理安装。
‘XXX’ 不是内部或外部命令,也不是可运行的程序
或批处理文件。
梦魇,程序猿的绝对梦魇!
4.CUDA和CUDNN重新安装
这个其实我也不过多赘述了,很多大神讲的都很详细。
个人总结的话还是比较简单的,如果你遇到了NON-GPU、不能检测到GPU等问题的话,如果不是代码问题,请直接重装,我一开始就是在代码指定策略和Tensorflow这两个地方耗时了。
卸载CUDA就是卸载四个CUDA相关
打开控制面板卸载还挺快的,记得看清楚就这四个,不要害怕更不要手抖!
请直接卸载。
如果你电脑有杀毒软件,也可以把注册表删除掉。
5.文件复制
重新安装成功CMD里面 nvcc -V 看到对应版本之后,你以为就可以调用GPU快乐的训练你的深度学习模型了?
年轻人还是图样图森破。
他会告诉你一堆dll文件找不到。这个时候我找了很多方法,我寻思我的系统变量、环境变量也没错呀。我这爪洼星人还能不会设置这两个变量不成?
最后发现是一个莫名其妙的坑。
不是大神留的贴我估计我睡前都会强迫症的检查重装设置一遍又一遍。
看清楚路径地址和你派叉报的错再来复制,别复制多了文件。
当然如果你派叉dll文件全部高阶人工智能找到对应文件了,那么恭喜你,你会遇到下一个坑了。
6. Loaded runtime CuDNN library: 7.4.1 but source was compiled with: 7.6.0.
这个bug很简单了就,英文翻译都能知道源码版本不一致。
看清楚斜体的CUDNN版本下载对应的CUDNN再次复制到SYSTEM文件夹下面就好了。
总结
研究生期间接触这两门语言,JAVA和PYTHON各有千秋利弊。
但这版本和环境配置却是实打实的一个又一个的坑,JAVA和其SSM中间件的JDK、POM、XML;PYTHON site-package和tensorflow的版本问题,真的是入门者必吃的闭门羹。
自此可以从爪洼星人转向调参侠了,希望研究僧和学生时代的最后有个好的结束吧。
XTBEHUMBLE!!!UP!UP!