算出该点导数的近似值,只要e足够小就行,高数内容
完整操作
Dvec是我们从反向传播中计算出来的导数
==================前面几个加一起的总步骤===================
4是关键,确认导数值相似后不要再使用上面计算gradapprox的方式,关掉梯度检验,因为计算量庞大,使用Dvec即可,因为高效
重要:
就是记得一旦验证反向传播的计算是正确的,就及时关闭梯度检测,不然每次都检验会特别特别慢,
算出该点导数的近似值,只要e足够小就行,高数内容
完整操作
Dvec是我们从反向传播中计算出来的导数
==================前面几个加一起的总步骤===================
4是关键,确认导数值相似后不要再使用上面计算gradapprox的方式,关掉梯度检验,因为计算量庞大,使用Dvec即可,因为高效
重要:
就是记得一旦验证反向传播的计算是正确的,就及时关闭梯度检测,不然每次都检验会特别特别慢,