反演方法草稿

最新推荐文章于 2023-03-24 15:53:23 发布

starlank

最新推荐文章于 2023-03-24 15:53:23 发布

阅读量4.2k

点赞数 2

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_44734025/article/details/109791025

版权

地下目标探测中的反演方法

第一部分数值优化算法
第二部分蒙特卡罗法
参考文献

第一部分数值优化算法

第1章优化方法概述

反演的流程一般来说包括构造目标函数和最优化目标函数两部分。反演算法指的就是最优化目标函数的算法。
如果在一个规划问题的目标函数和约束条件中，至少有一个方程式决策变量的非线性函数，就将这类规划问题称为非线性规划。当一个非线性规划问题的自变量x没有任何约束，或说可行域即是整个n维向量空间，则称这样的非线性规划问题为无约束问题。
所谓的无约束优化问题，就是对目标函数的求解，没有任何的约束限制的优化问题，比如求函数最小值。
求解这类的问题可以分为两大类：一个是最优条件法和迭代法。
最优条件法是是指当函数存在解析形式，能够通过最优性条件求解出显式最优解。对于无约束最优化问题，如果f(x)在最优点x附近可微，那么x是局部极小点的必要条件为：导数为零。我们常常就是通过这个必要条件去求取可能的极小值点，再验证这些点是否真的是极小值点。当上式方程可以求解的时候，无约束最优化问题基本就解决了。
实际中，这个方程往往难以求解。这就引出了第二大类方法：迭代法。

第2章梯度下降法

梯度下降法是迭代法的一种。
简单地来说，多元函数的“导数”(derivative)就是梯度(gradient)。
对于凸优化问题来说，导数为0（梯度为0向量）的点，就是优化问题的解。为了找到这个解，我们沿着梯度的反方向进行线性搜索，每次搜索的步长为某个特定的数值α，直到梯度与0向量非常接近为止。
$X^{i+1}=X^{i}-α\nabla f_{X^{i}}\tag{2.1}$
上面描述的这个方法就是梯度下降法。
全批量梯度下降法 简单来说，全批量梯度下降法就是在算目标函数梯度的时候带入所有样本点。全批量梯度法每计算一次梯度的代价是O(N)，运算次数与样本点数量N成线性关系。
随机梯度下降法 随机梯度下降法（Stochastic Gradient Decent, SGD）是对全批量梯度下降法计算效率的改进算法。SGD在计算∇L时，并不使用全部样本，而是随机地挑选了一个样本。全批量梯度下降虽然稳定，但速度较慢；SGD虽然快，但是不够稳定。
小批量随机梯度下降法 小批量随机梯度下降法（Mini-batch Stochastic Gradient Decent）是对速度和稳定性进行妥协后的产物。小批量随机梯度下降的关键思想是，我们不是随机使用一个样本，而是随机使用b个不同的样本。
最速下降法 最速下降法和梯度下降法唯一的区别就是，梯度下降法的步长lambda是固定的、人为设置的，而最速下降法是在确定了梯度后对步长的值进行一维搜索，选取最优步长。也可以说就是在确定迭代方向的前提上，确定在该方向上使得函数值最小的迭代步长。

第3章牛顿法和拟牛顿法

3.1 牛顿法原理

用牛顿法迭代解非线性方程：把非线性方程 f(x)=0线性化的一种近似方法。x₀作为初始近似解，在x₀领域内泰勒级数展开，保留其线性部分（前两项）(可以理解为切线):
$f(x)=f(x_0)+f^{'}(x_0)(x-x_0)\tag{3.1}$
求解
$f(x_0)+f^{'}(x_0)(x-x_0)=0\tag{3.2}$
得到下一个近似点 $x_1=x_0-\frac{f(x_0)}{f^{'}(x_0)}$
以此类推，不停迭代逼近真实解
$x_{n+1}=x_n-\frac{f(x_n)}{f^{'}(x_n)}\tag{3.3}$
另一种目标函数如求非线性方程f(x)极值，在近似解x₀领域内做二阶泰勒展开
$g(x)=f(x_0)+f^{'}(x_0)(x-x_0)+\frac{1}{2}f^{''}(x_0)(x-x_0)^{2}\tag{3.4}$
求 $g^{'}(x)=0$ ，即 $f^{'}(x_0)+f^{''}(x_0)(x-x_0)=0$ 得到一个新的近似解 $x_1=x_0-\frac{f^{'}(x_0)}{f^{''}(x_0)}$ ,迭代逼近真实解：
$x_{n+1}=x_n-\frac{f^{'}(x_n)}{f^{''}(x_n)}\tag{3.5}$
与求解f(x)=0不同得是，这里用了二次函数近似每个近似解的领域，而不是用线性函数。
当变量由单个变量x变为向量X时，仍可使用同样的求解方法，这时，迭代公式3.5中的一阶导 $f^{'}$ 变为了 $f$ 的梯度向量 $\nabla f$ ，二阶导 $f^{‘'}$ 变为了 $f$ 的海森矩阵 $\nabla ^{2}f$ 。迭代公式变为了：
$X_{k+1}=X_k-\frac{\nabla f(X_k)}{\nabla ^{2}f(X_k)}\tag{3.5}$
将梯度向量和海森矩阵分别记为 $g_k$ (gradient)和 $H_k$ (Hessian)。
$X_{k+1}=X_k-H^{-1}_k·g_k\tag{3.6}$
$d_k=-H^{-1}_k·g_k$ 称为牛顿方向。
阻尼牛顿法 原始牛顿法迭代公式中没有步长因子，是定步长迭代，不能保证目标函数值稳定的下降，所以使用阻尼牛顿法，每次在迭代方向