优化指的是改变 x x 以最大化或最小化某个函数 的任务.我们通常以最小化 f(x) f ( x ) 指代大多数的最优化问题,最大化可以通过最小化 −f(x) − f ( x ) 来实现。
- 我们通常把要最大化或者最小化的函数称为
目标函数(objective function)
或者准则(criterion)
。 - 我们通常使用一个上标 ∗ ∗ 表示最小化或最大化函数的 值,如 x∗=argminf(x) x ∗ = arg min f ( x )
在机器学习领域众多优化算法中,基于梯度的优化算法,是比较常用的一类。
首先,回忆一下微积分中 导数,偏导数,方向导数与梯度的关系。
对于一个一元函数 y