硬件踩坑——CUDA版本选择/安装(不同的深度学习项目需要不同CUDA,显卡与cuda匹配问题)

CUDA版本选择/安装(不同的深度学习项目需要不同CUDA)

源起

  1. 9月-11月测试深度学习的项目,由于个人的方向的论文主要集中于2017,2019年左右,这个阶段很多代码都是tensorflow1与tensorflow2兼有、python2与python3兼有,cuda主要用的是cuda8,cuda10
  2. 我的机器显卡是3060的(R9000P);然后租的机器是3090的,借的机器是A100的,显卡太新,跑不了我研究方向的很多项目(很长一段时间我都在抑郁,我的显卡不赖呀,竟然跑不起来代码,都想换课题了)

尝试的方法

  1. 在3060、3090的机器上安装cuda8 (不要这个干!!!瞎浪费时间,但是学会了超快安装cuda的方式,以至于我现在拿到机器本能的作出以下的反映);

  2. tensorflow1的项目使用tensorflow2环境跑(可以,但是需要改,会报以下几种错误,一般import tensorflow.compat.v1 as tf代替 import tensorflow as tf 可解决);

    • tf.placeholder() is not compatible with eager execution. (解决办法:在程序的开始加:tf.compat.v1.disable_eager_execution()
    • module ‘tensorflow’ has no attribute ‘…’ (解决办法:import tensorflow.compat.v1 as tf代替 import tensorflow as tf )
    • TypeError: batch_to_space_v2() got an unexpected keyword argument ‘block_size’ (解决办法:import tensorflow.compat.v1 as tf代替 import tensorflow as tf )
    • Not creating XLA devices, tf_xla_enable_xla_devices not set (可暂时性的忽视)
  3. 换项目,读代码,读项目中的issues (非常有用,对现在环境搭不起来有启发性作用,还能避免踩别人踩过的坑。我迷茫了,不知道干什么了,我要提醒自己干这个)

  4. 开始认真看报错:

    • libcudart.so.8.0: cannot open shared object file: No such file or directory (说明我的cuda版本不合适,项目要cuda8, 我的却是cuda11.7; 或在tensorflow的版本不合适)
    • errors_impl.NotFoundError: libcudart.so.8.0 (同上)
  5. 机器的显卡太新, 跑不了cuda

    • 在咸鱼上搞台老点的机器 (放弃了,没服务器方便,服务器可以一键换镜像)
    • 租老的显卡(像1080ti)
  6. 在python3 的conda 环境装 Python2 (emmmm,这个方法其实不管用,因为用的时候还是要不python3,要不python2, 不能像我想的那样——可以python2, python3代码混着写。 感觉自己好傻呀)

cuda的安装

参考:

  1. 安装步骤: https://blog.csdn.net/sinat_36721621/article/details/115326307
  2. 官方不同的版本:https://developer.nvidia.com/cuda-toolkit-archive
  • 33
    点赞
  • 77
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
根据引用\[1\]和引用\[2\]的内容,解决CUDA版本匹配问题的步骤如下: 1. 首先,使用命令nvidia-smi检查显卡驱动是否正常。如果不正常,需要安装正确的驱动。 2. 然后,使用命令nvcc -V检查当前安装CUDA版本是否符合项目需求。如果不符合,需要查找自己的显卡支持的CUDA版本。 3. 可以通过官方网站(https://developer.nvidia.com/cuda-gpus)或者搜索引擎(如https://cn.bing.com/)查询显卡支持的CUDA版本CUDA计算能力,以及Tensorflow_gpu对应的CUDA版本。 4. 找到一个支持项目所需CUDA版本的机器,再次使用nvidia-smi命令检查驱动和nvcc -V命令检查CUDA版本。 5. 如果CUDA版本符合项目需求,可以继续进行后续操作。 6. 如果CUDA版本不符合项目需求,需要卸载当前的CUDA安装符合要求的版本。可以参考引用\[3\]中提供的方法(https://blog.csdn.net/sinat_36721621/article/details/115326307)和官方网站(https://developer.nvidia.com/cuda-toolkit-archive)选择合适的版本进行安装。 7. 安装完成后,可以使用nvcc -V命令检查CUDA是否成功安装。 希望以上步骤能够帮助您解决CUDA版本匹配问题。 #### 引用[.reference_title] - *1* [硬件——CUDA版本选择/安装不同深度学习项目需要不同CUDA显卡cuda匹配问题)](https://blog.csdn.net/weixin_43686259/article/details/128098582)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [关于本机 CUDA 运行版与驱动版不匹配的解决方案](https://blog.csdn.net/m0_59705760/article/details/125757532)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值