报错内容
RuntimeError: copy_if failed to synchronize: device-side assert triggered
情况说明
本人遇到的这个问题主要是出现在损失计算处,由于损失计算时,矩阵运算产生了过大(INF)或者过小值(NAN),而使得数值越界断言触发。
个人解决方法
请检查以下几方面:
- 损失函数计算方法是否存在问题,特别是有除法运算、浮点数运算等,比如 1.05/0 这种问题;
- 进行损失计算的矩阵是否有问题;
- 是否可以考虑调整一下学习率;
ps:如果不是损失函数问题,可以贴一下问题,互相学习一下!