全部笔记的汇总贴:统计学习方法读书笔记汇总贴
一、算法描述
输入:目标函数 f ( x ) f(x) f(x),梯度函数 g ( x ) = ∇ f ( x ) g(x)=\nabla f(x) g(x)=∇f(x),计算精度 ε \varepsilon ε;
输出: f ( x ) f(x) f(x)的极小点 x ∗ x^* x∗。
- 取初始值 x ( 0 ) ∈ R n x^{(0)}\in\R^n x(0)∈Rn,置 k = 0 k=0 k=0。
- 计算 f ( x ( k ) ) f(x^{(k)}) f(x(k))。
- 计算梯度 g k = g ( x ( k ) ) g_k=g(x^{(k)}) gk=g(x(k)),当 ∣ ∣ g k ∣ ∣ < ε ||g_k||<\varepsilon ∣∣gk∣∣<ε时,停止迭代,令 x ∗ = x ( k ) x^*=x^{(k)} x∗=x(k);否则,令 p k = − g ( x ( k ) ) p_k=-g(x^{(k)}) pk=−g(x(k)),求 λ k \lambda_k λk,使 f ( x ( k ) + λ k p k ) = min λ ≥ 0 f ( x ( k ) + λ p k ) f(x^{(k)}+\lambda_kp_k)=\min_{\lambda\ge0}f(x^{(k)}+\lambda p_k) f(x(k)+λkpk)=λ≥0minf(x