任务描述
早已听闻mxnet大名,由于论文实验得需要,不得不刚一下mxnet了。果然与我意料的一样,刚开始就差点结束了。由于对mxnet的不熟悉,在安装的时候就出了一堆乌龙。
快乐安装
由于主要为了做一些目标检测的实验,如:SSD,R-CNN,YOLO,故我兴奋的选择GluonCV系列,选择安装,看到如下界面:
看到如此简洁的安装命令,我也是喜闻乐见,于是赶紧用conda建立了一个新的环境给mxnet。这里要解释为什么不用稳定版本,据同门安利,稳定版本很多新功能不能用。故作为一个由pytorch转tensorflow再转mxnet的萌新鬼,我就带着安装如此简单的快乐开始了下面一系列骚操作......此时我完全没有注意到cuda100 中的100......
快乐解Bug
安装完毕,直接import mxnet进行终极测试,此时我的电脑中已有CUDA9.0,无任何问题。于是跳出了下面这句Bug:OSError: [WinError 126] 找不到指定的模块。
没有问题,经过多方的查找,找到原因:缺少DLL文件!OK,那到底是缺少了哪个DLL文件呢,网上给出一个很远古的软件:Dependency Walker。于是我马上下载了,并根据提示,需要使用Dependency Walker打开安装的mxnet包下面的libmxnet.dll文件。libmxnet.dll文件在你安装的环境下的Lib\site-packages\mxnet,相信有深度学习功底的都能找得到。
于是,出现了以下的界面:
这个软件由于过于远古,所以卡了半天,不过最后还是宝刀未老,给出了重要结果,大致浏览会发现红框中圈出来的东西和CUDA有些关系,难道我缺少的文件和CUDA相关,但是我的电脑中的确已经存在CUDA9.0啦,难道是CUDA版本不对,这个100是不是暗示我我安装的mxnet版本必须适配CUDA10.0呢?答案是:Yes。
快乐CUDA并存
经过一系列快乐疑惑,我们的答案呼之欲出,那就是,本机的CUDA版本配不上安装的mxnet版本,难道要卸载CUDA9.0,安装CUDA10.0?那么本机一系列pytorch, tensorflow环境不久都崩了吗,呜呜呜。难道没有两全其美的方法,答案又是:Yes。Windows上CUDA的确可以共存,而且非常方便。方法?如下:
- 正常安装CUDA10.0
- 正常替换CUDNN
- 就OK了,实在不行重启个电脑
相信配置过深度学习环境的对以上操作都很熟悉,故这里就不再多介绍,不懂的小伙伴们呢,我在结束会给几个链接,方便大家配置。
快乐结束
都到这一步了,能做的也只有:阿门,无他,那么我成功了,你们呢?
参考链接
超有用链接:https://discuss.gluon.ai/t/topic/8390
windows多CUDA并存指南:https://blog.csdn.net/qq_27825451/article/details/89135592
windows下安装CUDA:https://blog.csdn.net/qq_37296487/article/details/83028394
备注:本文为作者原创,转载需注明出处