学习反向传播时候遇到的瓶颈:对为什么使用误差函数不理解。误差函数公式的推导不理解。反向传播的好处,由来。怎么计算。通过一下这篇文章以及其中的知乎连接有了深刻的理解 点击打开链接文中 此处应该是 不是l+1哦 梯度在一维是个标量(梯度下降就要考虑导数的正负) 梯度在高维有多个方向,梯度就是最大变化方向(负梯度就可以按梯度求导出来)