Broyden类算法

最新推荐文章于 2023-03-21 18:07:53 发布

Nightmare004

最新推荐文章于 2023-03-21 18:07:53 发布

阅读量3.2k

点赞数 1

分类专栏：数学文章标签：算法动态规划概率论

本文链接：https://blog.csdn.net/qq_39942341/article/details/122914318

版权

数学专栏收录该内容

144 篇文章 19 订阅

订阅专栏

本文深入探讨了拟牛顿法中的BFGS和DFP算法，以及它们之间的Broyden类算法。通过数学推导展示了Broyden类算法如何结合BFGS和DFP算法，并通过参数θk来调整两者的影响。还讨论了算法的正定性保持条件以及搜索方向的特性。最后，介绍了算法的迭代步骤和应用情况。

摘要由CSDN通过智能技术生成

拟牛顿法
 BFGS算法
 DFP算法

Broyden类算法

Broyden类算法是BFGS和DFP校正的凸组合产生的一类校正族
$\begin{aligned} \mathbf{B}_{k+1}^{\theta}&=\theta_k\mathbf{B}_{k+1}^{DFP}+\left(1-\theta_k\right)\mathbf{B}_{k+1}^{BFGS}\\ &=\mathbf{B}_{k+1}^{BFGS}+\theta_k\left(\mathbf{B}_{k+1}^{DFP}-\mathbf{B}_{k+1}^{BFGS}\right)\\ &=\mathbf{B}_k-\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}+\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}+\theta_k\left(\left(\mathbf{I}-\frac{\mathbf{s}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}\right)^T\mathbf{B}_{k}\left(\mathbf{I}-\frac{\mathbf{s}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}\right)+\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}-\mathbf{B}_k+\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}-\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}\right)\\ &=\mathbf{B}_k-\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}+\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}+\theta_k\left(\mathbf{B}_k-\frac{\mathbf{y}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{y}_k^T\mathbf{s}_k}-\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}+\frac{\mathbf{y}_k\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k\mathbf{y}_k^T}{\left(\mathbf{y}_k^T\mathbf{s}_k\right)^2}+\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}-\mathbf{B}_k+\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}-\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}\right)\\ &=\mathbf{B}_k-\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}+\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}+\theta_k\left(-\frac{\mathbf{y}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{y}_k^T\mathbf{s}_k}-\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}+\frac{\mathbf{y}_k\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k\mathbf{y}_k^T}{\left(\mathbf{y}_k^T\mathbf{s}_k\right)^2}+\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}\right)\\ &=\mathbf{B}_k-\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}+\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}+\theta_k\left(\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k\right)\left(\frac{\mathbf{y}_k}{\mathbf{y}_k^T\mathbf{s}_k}-\frac{\mathbf{B}_k\mathbf{s}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}\right)\left(\frac{\mathbf{y}_k}{\mathbf{y}_k^T\mathbf{s}_k}-\frac{\mathbf{B}_k\mathbf{s}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}\right)^T \end{aligned}$
令
$\mathbf{u}_k=\sqrt{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}\left(\frac{\mathbf{y}_k}{\mathbf{y}_k^T\mathbf{s}_k}-\frac{\mathbf{B}_k\mathbf{s}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}\right)$
$\begin{aligned} \mathbf{B}_{k+1}^{\theta}&=\theta_k\mathbf{B}_{k+1}^{DFP}+\left(1-\theta_k\right)\mathbf{B}_{k+1}^{BFGS}\\ &=\mathbf{B}_k-\frac{\mathbf{B}_k\mathbf{s}_k\mathbf{s}_k^T\mathbf{B}_k}{\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k}+\frac{\mathbf{y}_k\mathbf{y}_k^T}{\mathbf{y}_k^T\mathbf{s}_k}+\theta_k\mathbf{u}_k\mathbf{u}_k^T \end{aligned}$

把 $\mathbf{B}$ 换成 $\mathbf{H}$ ,然后 $\mathbf{s}$ 和 $\mathbf{y}$ 互换
令
$\mathbf{v}_k=\sqrt{\mathbf{y}_k^T\mathbf{H}_k\mathbf{y}_k}\left(\frac{\mathbf{s}_k}{\mathbf{s}_k^T\mathbf{y}_k}-\frac{\mathbf{H}_k\mathbf{y}_k}{\mathbf{y}_k^T\mathbf{H}_k\mathbf{y}_k}\right)$
$\begin{aligned} \mathbf{H}_{k+1}^{\phi}&=\phi_k\mathbf{H}_{k+1}^{BFGS}+\left(1-\phi_k\right)\mathbf{H}_{k+1}^{DFP}\\ &=\mathbf{H}_k-\frac{\mathbf{H}_k\mathbf{y}_k\mathbf{y}_k^T\mathbf{H}_k}{\mathbf{y}_k^T\mathbf{H}_k\mathbf{y}_k}+\frac{\mathbf{s}_k\mathbf{s}_k^T}{\mathbf{s}_k^T\mathbf{y}_k}+\phi_k\mathbf{v}_k\mathbf{v}_k^T \end{aligned}$

可以证明(没证明过)
$\theta_k=\frac{1-\phi_k}{1-\phi_k\left(1-\mu_k\right)}$
其中
$\mu_k=\frac{\left(\mathbf{s}_k^T\mathbf{B}_k\mathbf{s}_k\right)\left(\mathbf{y}_k^T\mathbf{H}_k\mathbf{y}_k\right)}{\left(\mathbf{s}_k^T\mathbf{y}_k\right)^2}$

性质

性质1

用Broyden族算法求解
$\min f\left(\mathbf{x}\right)=\frac{1}{2}\mathbf{x}^T\mathbf{G}\mathbf{x}+\mathbf{b}^T\mathbf{x}+c$
若初始矩阵 $\mathbf{H}_0$ 是正定的，算法所产生的迭代点是互异的。则
（1）当 $\mathbf{y}_k^T\mathbf{s}_k>0$ 且 $\phi_k\ge 0$ 或 $\theta_k\ge 0$ 时，Broyden族校正公式保持正定性
（2）算法所产生的搜索方向 $\mathbf{d}_0,\cdots,\mathbf{d}_k\left(k\ge n-1\right)$ 满足
（a) $\mathbf{d}_i^T\mathbf{G}\mathbf{d}_j=0,\quad 0\le i<j\le k$
(b) $\mathbf{H}_k^\phi\mathbf{y}_i=\mathbf{s}_i,\quad 0\le i\le k-1$
证明：
（1）与前面BFGS那里类似
（2）再说吧

$\mathbf{H}_{k+1}=\begin{cases} \mathbf{H}_k,&\mathbf{s}_k^T\mathbf{y}_k\le 0\\ \mathbf{H}_{k+1}=\mathbf{H}_k-\frac{\mathbf{H}_k\mathbf{y}_k\mathbf{y}_k^T\mathbf{H}_k}{\mathbf{y}_k^T\mathbf{B}_k\mathbf{y}_k}+\frac{\mathbf{s}_k\mathbf{s}_k^T}{\mathbf{s}_k^T\mathbf{y}_k}+\phi\mathbf{v}_k\mathbf{v}_k^T&\mathbf{s}_k^T\mathbf{y}_k>0 \end{cases}$

步骤

初始化：选择起点 $\mathbf{x}_0$ ,
选择 $\mathbf{H}_0$ (一般取 $\nabla^{-2} f\left(\mathbf{x}_0\right)$ 或者 $\mathbf{I}$ )

步骤
1.若 $\|\mathbf{g}_k\|\le \epsilon$ ,停止，输出 $\mathbf{x}_k$
2.计算 $\mathbf{d}_k=-\mathbf{H}_k\mathbf{g}_k$
3.求步长 $\alpha_k$
4. $\mathbf{x}_{k+1}=\mathbf{x}_k+\alpha_k\mathbf{d}_k$ ,矫正 $\mathbf{H}_{k}$ 得到 $\mathbf{H}_{k+1}$
5.k=k+1,转1