Descent Method for 最小化（最优化）问题（二）

最新推荐文章于 2022-09-26 21:16:43 发布

WenguoHou

最新推荐文章于 2022-09-26 21:16:43 发布

阅读量570

点赞数 1

分类专栏： Optimization Implicit Method

本文链接：https://blog.csdn.net/wg_hou/article/details/78960710

版权

本文深入探讨了非线性共轭梯度下降法，包括问题形式、共轭性定义、共轭方向算法、共轭梯度算法及其收敛性。介绍了Fletcher-Reeves方法，该方法将共轭梯度法扩展到非线性函数的优化问题中，通过线性搜索确定步长并用梯度替代残差。

摘要由CSDN通过智能技术生成

4 Nonlinear conjugate gradient （非线性共轭梯度下降法）

先从（线性）CG 算法说起：

以下摘自：数值优化（Numerical Optimization）学习系列-共轭梯度方法（Conjugate Gradient）

4.0 问题形式

（线性）CG算法求解问题的两种形式：
1. 线性方程 $\mathbf{Ax} = \mathbf{b}$ 并且要求矩阵 $\mathbf{A}$ 是对称正定矩阵。
2. 最优化问题：

min x ϕ (x) = 1 2 x T A x - b T x

$\min \limits_{\mathbf{x}} \phi(\mathbf{x}) = \frac{1}{2} \mathbf{x}^T \mathbf{A} \mathbf{x} - \mathbf{b}^T\mathbf{x}$
要求矩阵

A $\mathbf{A}$ 对称正定，这样该问题是一个凸问题并且有最优解。根据最优解满足

∇ϕ(x)=Ax−b=0 $\nabla \phi(\mathbf{x}) = \mathbf{Ax} -\mathbf{b} = \mathbf{0}$ ，一般记为

r(x) $\mathbf{r}(\mathbf{x})$ 。在迭代过程中，第

K $K$ 步的残差表示为

rk=Axk−b $\mathbf{r}_k = \mathbf{Ax}_k - \mathbf{b}$ 。

（注：向量积对列向量 $X$ 求导运算法则：
$d(UV^T)/dX = (dU/dX)V^T + U(dV^T/dX)$
$d(U^TV)/dX = (dU^T/dX)V + (dV^T/dX)U$
则有：
$d(X^TA)/dX = (dX^T/dX)A + (dA/dX)X^T = IA + 0X^T = A$
$d(AX)/dX^T = (d(X^TA^T)/dX)^T = (A^T)^T = A$
$d(X^TAX)/dX = (dX^T/dX)AX + (d(AX)^T/dX)X = AX + A^TX$

共轭性

给定一个非零向量集合 $\{ p_0, p_1, \cdots, p_{n-1} \}$ 和一个对称正定矩阵 $\mathbf{A}$ ，如果向量集合相对于 $\mathbf{A}$ 是共轭的，当且仅当 $p_i^TAp_j = 0, i \neq j$

如果向量集合是共轭的，则他们之间是相互线性独立的。

4.1 共轭方向算法

共轭方向算法 (Conjugate direction method) 不同于共轭梯度算法，共轭向量提前给出。共轭梯度算法则给出了共轭向量（方向）的计算方法。

（即假定共轭方向已知的情况下，如何计算最优化问题）

算法描述：
1. 给定共轭方向集合 $\{ p_0, p_1, \cdots, p_{n-1} \}$ 和任意初始点 $x_0$ 。
2. 计算 $x_{k+1} = x_k + \alpha_kp_k$
3. 计算最优步长 $\alpha$ ：此时假定 $x_k$ 为已知量（定值），通过优化 $\p$

最低0.47元/天解锁文章

WenguoHou

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Descent Method for 最小化（最优化）问题（二）

4 Nonlinear conjugate gradient （非线性共轭梯度下降法）先从（线性）CG 算法说起：以下摘自：数值优化（Numerical Optimization）学习系列-共轭梯度方法（Conjugate Gradient） 4.0 问题形式（线性）CG算法求解问题的两种形式： 1. 线性方程 Ax=b\mathbf{Ax} = \mathbf{b} 并且要求矩
复制链接

扫一扫