yolov5训练集出现报错:RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERRORYou can try to repro this excep

在使用YOLOv5进行训练时遇到RuntimeError: cuDNN错误:CUDNN_STATUS_INTERNAL_ERROR。文章解释了错误原因,并提供了调整batch-size和workers参数的建议。降低batch-size至4以避免显存溢出,同时将workers设为4以防止CPU内存过载导致其他进程关闭。
摘要由CSDN通过智能技术生成
if __name__ == '__main__':
   
    parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs')

parser.add_argument('--batch-size', type=int, default=4, help='total batch size for all GPUs')

含义:batch-size设置多少就表示一次性将多少张图片放在一起训练,就是一次往GPU哪里塞多少张图片了,如果设置的太大会导致爆显存,一般设置为8的倍数,我这里设置的是4,会一次性训练4张图片。


train.py中关于workers设置代码如下:

parser.add_argument('--workers', type=int, default=8, help='maximum number of dataloader workers')

parser.add_argument('--workers', type=int, default=8, help='maximum number of dataloader workers')

workers是指数据装载时cpu所使用的线程数,默认为8,但是按照默认的设置来训练往往会导致我们的CPU爆内存,会导致其他进程进行关闭(例如浏览器),我的电脑设置为4是刚刚可以利用完内存
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
当你在使用深度学习框架的过程中遇到 `RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED` 这个错误时,通常是由于cuDNN库执行失败引起的。 cuDNN是由NVIDIA提供的用于加速深度神经网络的库,它在GPU上进行计算,并提供了包括卷积、池化等操作的实现。当你的深度学习框架调用cuDNN库执行某个操作时,如果操作发生错误,就会报错并显示 `CUDNN_STATUS_EXECUTION_FAILED`。 解决这个问题的方法有以下几个: 1. 检查cuda版本和cudnn版本是否对应:cuDNN库和cuda库是密切关联的,要保证它们的版本兼容。可以查看cuDNN的官方文档或者深度学习框架的官方文档,确认当前使用的cuDNN版本与cuda版本是否匹配。 2. 检查显卡驱动是否正常:cuDNN库需要与显卡驱动配合使用,所以确保你的显卡驱动已正确安装并与cuDNN库兼容。 3. 检查显存是否足够:有时候由于显存不足,cuDNN无法完成操作。可以尝试减少显存的使用,例如减少批量大小或者减少网络的复杂度。 4. 检查硬件是否过热:如果你的GPU温度过高,可能会导致cuDNN执行错误。可以尝试降低GPU的工作负载、提高散热效果或者增加散热设备。 5. 检查代码或模型是否有错误:有时候cuDNN执行错误是因为代码或者模型本身存在问题。可以检查相关的代码部分,确认是否有错误,并参考深度学习框架的文档对模型进行调试。 如果以上方法都无法解决问题,可以尝试更新深度学习框架、cuDNN库或者cuda库的版本,或者咨询相关技术支持。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值