反向传播原理比较简单,先定义损失函数,然后使用梯度下降算法找到最小化损失函数的W和b,梯度下降算法需要计算损失函数对w和b的偏导,求偏导只使用了一个链式法则。
1、反向转播
2、参数更新
η是学习率
反向传播原理比较简单,先定义损失函数,然后使用梯度下降算法找到最小化损失函数的W和b,梯度下降算法需要计算损失函数对w和b的偏导,求偏导只使用了一个链式法则。
1、反向转播
2、参数更新
η是学习率
转载于:https://www.cnblogs.com/yongfuxue/p/10095710.html