报错截图 解决方法 其实并没有解决,不过我的错误出现在Transformer模块的Decoder中,原本的query 为256喂,而我修改为512维后一直报这个错无法解决,因此我决定不解决该错误,还原回256即可。 第二次报错 没想到啊没想到,它又来了,再我修改了一些代码后,又出现了这个问题: 这次的解决方法 给transformer的输出加了个detach()就行了。 参考文章:感觉应该是我的问题所在,但是我没找出具体的错误位置:报错解决:RuntimeError: Function AddmmBackward returned an invalid gradient at index 1 - got [20, 512] but expFunction AddmmBackward returned an invalid gradient at index 1报错解决