- 手动
model.fit
进行批训练,momentium
对应的历史梯度信息没有保存,lr
也不会修改 - 手动
model.train_on_batch
进行批训练,momentium
貌似保存了,但lr
不会修改 - 手动
tape.gradient
求导时,Normalization
层没有更新
解决方案:
- 手动批训练时,尽量使用
train_on_batch
,手动更新lr
,一个公式是lr = lr / (1 + lr_rate * iterations)
- 手动求导时,注意启动训练模式
model(x, training=True)