- 博客(3)
- 收藏
- 关注
原创 RuntimeError: invalid argument 5: k not in range for dimension at /pytorch/aten/src/THC/generic/THC
作者在训练一个分类模型时在train时没有报错,但是在验证val时报了这个错误。意思是当前只有5各分类,无法计算top5准确率。找到代码修改分类数解决。
2024-05-20 18:34:48 124
原创 RuntimeError: Expected to have finished reduction in the prior iteration before starting a new one
如果您已经完成了上述操作,那么分布式数据并行模块无法在模块的“正向”函数的返回值中定位输出张量。报告此问题时,请包括您的模块的损失函数和“转发”返回值的结构(例如list、dict、iterable)。此外,您可以将环境变量TORCH_DISTRIBUTED_DEBUG设置为INFO或DETAIL,以打印出有关哪些特定参数没有在此列组上接收到梯度的信息,作为此错误的一部分。此错误表示您的模块具有未用于产生损失的参数。但却没有加入forword函数中,就将实例化模块注释掉,解决!
2024-05-11 01:01:00 1210
原创 tadaconv-main训练报错及解决方案
因为作者使用了自己的数据集且数据集只有5个分类,但是加载的预训练模型tadaconvnextv2_tiny_in1k_k400_79.6.pyth是由Kinetics 400训练得到的
2024-05-10 01:16:24 252
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人