电脑cudn版本12+
机器学习框架要求cudn版本11+
最初因为提示缺少对应的文件
缺少cublas64_11.dll、cublasLt64_11.dll等等文件,
然后把对应的cublas64_12.dll、cublasLt64_12.dll、cudart64_12.dll进行了复制重命名为对应的缺少的文件
然后GPU能跑了
就这么用了一段时间后,突然有一天,在使用GPU跑机器学习框架的时候出现突然报错,在tensorflow、keras中报错提示为
failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED
No compatible GPU found, CUDA driver not installed or disabled, CUDA runtime
..............................此处省略其他报错提示,找不到报错记录了
在paddle中报错提示为:
InternalError: Attempting to perform BLAS operation using StreamExecutor
网上找了很多,大多数说是显存溢出,有少数说版本不匹配,然后按照显存溢出的办法去尝试解决,没解决掉,最后看到一个文章说有文件损坏的可能,于是再次进行尝试
把原来复制出来的这些文件:cublas64_11.dll、cublasLt64_11.dll 全部删除 然后重新复制然后重命名文件,再次尝试问题解决