引发错误目前看来有两种情况:
1、应该是在损失函数中,模型输出为首个实参,ground_truth为第二个实参,写反了会出现这种情况
loss = criterion(output,label) #正确
loss = criterion(label,output) #错误
2、第二种情况,ground_truth需要与模型的某些参数运算后得到模型需要的标签,然后引发错误:
#错误写法
label=torch.autograd.Variable(label)
label=model.param1*label
loss=criterion(output,label)
#正确写法
label=model.param1.data*label #此时label是一个tensor
label=torch.autograd.Variable(label)
loss=criterion(output,label)
原因解释:
因为是自动求导机制,所以,如果用模型某个参数(是变量),直接逐元素相乘label,那会影响自动求导机制,所以应该只用模型参数的data,这样相当于是一个值的copy,不会影响求导机制