为什么要设置学习率 朴素的调整方法会出现一个问题,即改进后的模型只与最后一个训练样本最匹配,忽略了所有以前的训练样本。解决这个问题的一种好的方法是使用学习率,调节改进的速率,这样单一的训练样本就不能主导整个学习过程。