参考资料 一、注意点: tf.gradient(loss, var) 这里的var必须和loss挂钩,如果不挂钩会报NoneError错误,即说明该变量没有梯度。 grad = tf.stop_gradient(grad) 截断grad结点之前的梯度,相当于电路__grad这个灯泡不亮了。