Function AddmmBackward returned an invalid gradient at index 1 - got [5, 256] but expected shape compatible with [5, 1870] 这个错误通常是由Linear层的维度不匹配造成的,例如,我们输入是1870维度,我们想要的维度是1870维,但是用的线性层是[256, 1870]维度,虽然在计算的时候不会出错,但是在梯度回传时就是报上面的错,解决办法很简单,将Linear层改为[1870, 1870]即可。