- Hessian矩阵是 n∗n n ∗ n 的所以空间复杂度会很高
为什么深度学习不使用牛顿法或拟牛顿法优化
最新推荐文章于 2024-07-17 02:05:32 发布
由于深度学习的优化目标通常是非凸的,牛顿法及其变种如拟牛顿法在解决此类问题时可能会导致优化过程不稳定。高维空间中的Hessian矩阵计算复杂度高,且非凸性质使得牛顿法无法保证每次迭代都能降低目标函数。因此,实践中更倾向于使用梯度下降类方法。
摘要由CSDN通过智能技术生成