损失一点都不变。我输出梯度一看,也纹丝不动,字面意思。 可能是我最后relu后跟了一个sigmoid。因为我注释掉relu,梯度开始变化。(BCELoss需要sigmoid,我就留着它了) 明早看看实验结果。