【recbole】在配好recbole需要的环境后,仍无法使用GPU/GPU占用率0%

recbole需要配置的环境有:

即电脑需要有已经配置好的python+cuda+cudnn+pytorch的环境,以及有NVIDIA的GPU(recbole要求必须是nvidia的)

测试电脑GPU是否能够使用的代码:(储存为test.py)

import torch
print('CUDA版本:',torch.version.cuda)
print('Pytorch版本:',torch.__version__)
print('显卡是否可用:','可用' if(torch.cuda.is_available()) else '不可用')
print('显卡数量:',torch.cuda.device_count())
print('是否支持BF16数字格式:','支持' if (torch.cuda.is_bf16_supported()) else '不支持')
print('当前显卡型号:',torch.cuda.get_device_name())
print('当前显卡的CUDA算力:',torch.cuda.get_device_capability())
print('当前显卡的总显存:',torch.cuda.get_device_properties(0).total_memory/1024/1024/1024,'GB')
print('是否支持TensorCore:','支持' if (torch.cuda.get_device_properties(0).major >= 7) else '不支持')
print('当前显卡的显存使用率:',torch.cuda.memory_allocated(0)/torch.cuda.get_device_properties(0).total_memory*100,'%')

在终端中跑以上代码:

python test.py

注意一定要先打开虚拟环境,再用这段代码检查是否配置成功,能检测到GPU

(一般跑recbole都是新建虚拟环境再在虚拟环境中跑)

目前看到是有显卡,且pytorch和cuda版本也是对的。

但是在recbole手册中用指令安装recbole后就检测不到显卡了。

原因:在recbole官网中,conda指令安装会附带一些requirement,安装的版本会覆盖掉我们自己已经安装好的版本,(大概率是变成了cpu版本的torch,所以在执行指令后发现device=cpu且任务管理器中GPU占用为0%)

解决:直接用pip指令就好啦!

pip install recbole

再执行代码后:看device=cuda就成功啦!

but: 在任务管理器中GPU利用率仍然是0%,我看到有解决方法说可以把上面的3d那个换成CUDA就行,但是我没有这个选项。

所以在终端中输入:nvidia-smi,也可以查看GPU的使用率~

如图62%,说明GPU在使用中。

  • 10
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值