前提
神经网络存在合适的权重和偏置,而调整权重和偏置的过程称为‘学习’。然后神经网络的学习分为下面4个步骤
步骤1(mini-batch)
从训练数据中随机选取一部分数据,这部分数据称为mini-batch。因为在具体的学习过程中具体的数据太多,不可能全部的学习一边,可以通过随机抽取一部分来代替整体。我们的目标是减小mini-batch的损失函数的值。
步骤2(计算梯度)
为了减小mini-batch的损失函数的值,需要求出各个权重的梯度。梯度表示损失函数值减小最多的方向。
步骤3(更新参数)
将权重参数沿着梯度方向进行微小更新。
步骤4(重复)
重复步骤1,2,3.直到损失函数的值很小