[20221004]莫名其妙的dataloader 无法在读写模式下打开共享内存对象 错误

问题1:
在训练过程中报错:

RuntimeError: falseINTERNAL ASSERT FAILED at "../aten/src/ATen/MapAllocator.cpp":263, please report a bug to PyTorch. unable to open shared memory object </torch_35874_0> in read-write mode

大致意思为无法在读写模式下打开共享内存对象,该错误并非出现在某个固定时间节点或epoch,而是随机出现在某个seed训练过程中的某个epoch,所以并不好定位错误。
解决方案
我目前认为是dataloader num_workers参数设置的过大的问题,如果后续还遇到相同报错再尝试去其他解决方案。

问题2:

optimizer = torch.optim.Adam(model.parameters(), lr=config.lr, weight_decay=config.wd)
scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, gamma=config.gamma,milestones=[int(v) for v in config.lr_sched.split(',')])

scheduler.step() # update lr
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值