从接触深度学习开始,就不断听到随机梯度下降这个名词。那么这到底是个什么东东呢?
随机梯度下降是用来求损失函数系数的最优解的,
什么是损失函数呢?损失函数就是你模型的预测值和真实值之间的差距
怎么求呢?就是求损失函数最小值(或者能找到的最小值)对应的系数,我们希望损失函数值往波谷的方向走,那么怎么知道波谷的方向呢,就是梯度下降的方向
所以,只要对各个系数求偏导,偏导最小,则为最优解。
更简洁明了的可以参考博客http://www.cnblogs.com/aijianiula/p/5173315.html