如果你有幸能够看到这一篇专栏,我相信你有很大的可能就不会是一个纯小白。其他的配置选项在csdn上都有很多详细的说明,这里就不过多赘述。
本人之前使用的yolov3模型都是基于帕斯卡架构,用我笔记本的1050ti显卡去苟延残喘,在keras-yolov3上写一些小demo。
但是自从我升级了原先的电脑配件,尤其是显卡由1050ti升级到2070之后,原先的配置环境就失效了。总是会出现blas gemm launch fail显示爆显存相关的错误。我知道是由于图灵架构对于cuda9的兼容性并不好。
在这个问题上,我困了许久,求助了各路大神但是都没有找到什么比较好的解决方法。不论是网上自行更改代码创建会话,还是限制GPU的使用效率,抑或是下载补丁都没有效果。
最终经过我的不断摸索,想要在图灵架构上运行的话,还是得重新配置版本,接下来我就将最关键的部分列出来。
tensorflow-gpu==1.13.1 在anaconda中安装的时候要注意他应该会自行下载cudatoolkit10的对应版本如果没有自行下载,那么就手动下载cudatoolkit==10.0.130(利用conda install命令)
keras==2.2.4 原先是2.1.4的版本现将其升级
接下来是cudnn这个版本的选择就会很多只要匹配cuda10就行。一般在下tensorflow-gpu时会一并下载下来,如果没有的话就利用conda install的命令手动下载cudnn==7.6.5或者稍低一点的相关版本也行。
这样的话在图灵架构下也能够成功运行基于keras的yolov3。