要对数值梯度和解析梯度的相对误差敏感,设相对误差为ce,则
ce > 1e-2:梯度出错,不可取
1e-4 < ce < 1e-2:也不是理想的值
ce < 1e-4:对于不可导的目标函数是可以的,但是若目标函数没有kink(使用tanh和softmax),则还是太高
ce < 1e-7:好的结果
其他基本上和svm相同。
在做cs231n作业一的softmax时,遇到的问题和解决办法
最新推荐文章于 2021-09-03 21:16:50 发布
要对数值梯度和解析梯度的相对误差敏感,设相对误差为ce,则
ce > 1e-2:梯度出错,不可取
1e-4 < ce < 1e-2:也不是理想的值
ce < 1e-4:对于不可导的目标函数是可以的,但是若目标函数没有kink(使用tanh和softmax),则还是太高
ce < 1e-7:好的结果
其他基本上和svm相同。