主要讲讲SiamMask环境配置的坑
项目场景:SiamMask
—详细的可以看看作者Qiang Wang的知乎https://zhuanlan.zhihu.com/p/58154634
—项目代码:https://link.zhihu.com/?target=https%3A//github.com/foolwood/SiamMask
问题描述
由于是第一次弄服务器,跑项目时出现的问题只能一点点摸索,首先这是按要求配置好虚拟环境后跑下面这个代码
bash test_mask_refine.sh config_vot.json SiamMask_VOT.pth VOT2016 0
接着出现这个问题
RuntimeError: CuDNN error: CUDNN_STATUS_SUCCESS
原因分析:
搜了一下是说我cdua版本低,我检查我服务器的cuda版本是10.2,而项目要求的是9.2,于是小白的我弄了好几天才把服务器cuda版本换成9.2(给自己埋了个大坑)接下来就是另一个问题
RuntimeError: CUDA error: no kernel image is available for execution on the device at /pytorch/aten/src/THCUNN/generic/Threshold.cu:34
原因分析:
检查后发现,是我cuda9.2版本太低了,而且弄半天才发现cuda版本是向下兼容的,也就是只要根据服务器能适应的最高版本更新到最新就行了。
解决方案:
1、先是把服务器的cuda版本从官网上下载更新成最新的cuda-11.3
,命令nvcc -V
查看当前服务器版本
2、接着更新并查看当前虚拟环境的cuda版本是否更新conda list | grep cuda
提示:这里并不用根据项目的要求
cuda9.2
因为向下兼容了
至此!代码终于能跑通了!!!
但后面更新了tensorflow包之后,numpy的导入就出现问题,只要更新下numpy就行了