類神經網路訓練不起來怎麼辦 (一): 局部最小值 (local minima) 與鞍點 (saddle point) 類神經網路訓練不起來怎麼辦 (二): 批次 (batch) 與動量 (momentum) Training Loss 和 Testing Loss 之间的差距: Mismatch Optimizer加上Momentum之后会有更好的效果:越过局部最优解