线性共轭梯度法python_数值优化|笔记整理（3）——线搜索中的步长选取方法，线性共轭梯度法...-CSDN博客

本文介绍了线性共轭梯度法的原理与应用，包括线搜索中的步长选取方法，如插值法、Strong-Wolfe条件，以及初始步长选取策略中的BB步长。此外，还探讨了非单调下降迭代法和线性共轭梯度法在解决线性优化问题时的高效性，展示了它们在二次凸问题中的优势。

摘要由CSDN通过智能技术生成

上一节笔记传送门：学弱猹：数值优化|笔记整理(2)——线搜索：步长选取条件的收敛性zhuanlan.zhihu.com

————————————————————————————————————

大家好！

我们在上一节花了很多篇幅介绍了线搜索中，步长选取条件的收敛性。那么在这一节，我们会开始关注线搜索中，如何实操中设计不同步长选取条件算法，并且还会关注线搜索中初始步长的选取。当然了，这些部分没有太多的理论性，因此不会占据太长的时间，所以我们可能还会介绍一下优化中的共轭梯度法。

那么我们开始吧。

目录回溯法多项式插值

Strong-Wolfe条件下的多项式插值

初始步长选取——BB步长

非单调下降迭代法简介

共轭梯度法线性情形

SourceJ. Nocedal, S. J. Wright, Numerical Optimization

J. Barzilai and J. M. Borwein, Two-Point Step Size Gradient Methods

回溯法多项式插值

我们在上一节主要介绍了线搜索算法的收敛性，同时我们给出了最速下降法(也叫梯度下降法)的一个算法模板。那么为什么这一节还要在这上面花篇幅呢？事实上我们把我们之前的话反过来说，就是优化具有很强的理论性，但是同样具有很强的实用性。也就是说，如果我们没有考虑到实际应用中所面对的问题，那么一样不能够算学好了优化。因此仅仅通过回溯法(backtracking)去寻找步长自然是不够的，我们还有一些其他的方法可以用来帮助我们选取步长。事实上我们只需要知道这些方法在实操中具有很好的效果就足够了，因为他们的理论比较超纲，掌握并没有太大的必要(事实上在优化中，这样的情况非常常见)。也因此在这一部分，虽然我们的内容量不如之前的理论那么多，也不会有理论部分那么详细，但是其最重要的部分在于实操，也因此在这一块，寻找数值例子和编程才是最重要的。

好的，我们回到我们的正题，也就是插值法。为什么使用插值法呢？这是使用了一个插值逼近的思想。假如说我们有一些点，那么通过这一些点就可以做插值，得到一条曲线。这一条曲线就可以算是插值函数。如果我们只有点本身的信息(比方说

)，那么这就是拉格朗日插值，如果还会利用上这个点导数的信息，那么这就是埃尔米特插值(注意Hermite的开头字母H是不发音的)插值函数可以用来逼近我们的实际的函数曲线。

现在我们考虑我们构造的函数

，其中

为步长，

为当前迭代点，

为搜索方向。并且我们有了一个初始步长

(如果是我们的上一节所提到的A-G条件对应的步长，这个初始步长就是1)。那么这样的话实际上我们有了3个信息：

这是一个带有函数导数的值，所以通过埃尔米特插值，我们可以得到一个二次函数。我们也会用这个二次函数来近似我们的

在

上的行为。

有了插值函数之后，我们希望取插值函数所对应的最小值点作为我们的步长。这是因为我们的思想就是用插值函数来代替我们的原始的函数