关于变分法

最新推荐文章于 2024-11-03 10:30:26 发布

B417科研笔记

最新推荐文章于 2024-11-03 10:30:26 发布

阅读量2.1k

点赞数 7

分类专栏：数学推导通信中的常用数学文章标签：线性代数算法几何学

本文链接：https://blog.csdn.net/weixin_39274659/article/details/124538704

版权

通信中的常用数学同时被 2 个专栏收录

48 篇文章

订阅专栏

数学推导

19 篇文章

订阅专栏

在介绍变分贝叶斯之前，首先以这篇博客介绍下大名鼎鼎的变分法。参考资料主要是知乎的文章与维基百科。

变分就是函数的微分。

回顾一下传统的函数优化问题。对于 $min_x f(x)$ 这样的优化问题，求取最优的 $x$ 的做法常用一阶条件，即：
$\frac{\partial f}{\partial x^\star} =0$
对应的物理意义是从该点出发的任何变化方向都无法让函数值进一步下降，也即:
$f(x^\star) \le f(x^\star + \epsilon dx)$
因此，这也是最优的 $x^\star$ 的必要条件，容易通过反证法求证。如果将这个方法称为变量求最优解的微分法，那变函数求最优解的类似方法就是变分法。具体而言，此时变量 $x$ 成了给定的东西，我们要通过优化函数来最小化函数值，也即 $min_f g(f(x))$ 。 $g$ 就是以函数为变量的目标函数，而函数的变化量就是变分。我们通过一个经典的例子来进行阐释。

在这里插入图片描述

如上图所示，存在函数 $y = f (x)$ 。对应上图 $y1 = f(x_1)$ , $y_2 = f(x_2)$ 。我们的问题是寻找给定的 $(x 1, y 1)$ 和 $(x 2, y 2)$ 间的最短距离所对应的 $f$ 函数。通过小学知识我们知道，结论是两点之间线段最短。现在我们通过变分法论证这一点，也即 $f$ 函数是一个一次线性函数。

首先，我们可以将 $(x 1, y 1)$ 和 $(x 2, y 2)$ 间的距离显示地写出，作为我们的目标函数。具体地，我们取线上的一小段微元 $d s$ （参考上图)，根据勾股定理显然有（注意是 $dy^2$ 不是 $d^2y$ ）：
$s^{2}=d x^{2}+d y^{2}=\left[1+\left(y^{\prime}\right)^{2}\right] d x^{2}$
因此 $s=\sqrt{1+\left(y^{\prime}\right)^{2}} d x$ ，总路径长度可写为：

$A[f]=\int_{x_{1}}^{x_{2}} \sqrt{1+\left[f^{\prime}(x)\right]^{2}} d x$

此时路径长度为函数 $f$ 的函数。类似于一阶条件，假设 $f_0$ 是能达到局部最小的函数，那么有：
$A\left[f_{0}\right] \leq A\left[f_{0}+\epsilon f_{1}\right]$
其中 $f_1$ 是以 $x 1$ 和 $x 2$ 为端点的任意函数， $\epsilon$ 代表一个极小值。类似地，这就要求对于任意 $f_1$ ，当 $\epsilon\rightarrow 0$ 时， $A\left[f_{0}+\epsilon f_{1}\right]$ 对 $\epsilon$ 的导数为 $0$ ：（对于给定的 $f_1$ ， $A\left[f_{0}+\epsilon f_{1}\right]$ 是 $\epsilon$ 的函数）

$\left.\frac{d}{d \epsilon} \int_{x_{1}}^{x_{2}} \sqrt{1+\left[f_{0}^{\prime}(x)+\epsilon f_{1}^{\prime}(x)\right]^{2}} d x\right|_{\epsilon=0}=\left.\int_{x_{1}}^{x_{2}} \frac{\left(f_{0}^{\prime}(x)+\epsilon f_{1}^{\prime}(x)\right) f_{1}^{\prime}(x)}{\sqrt{1+\left[f_{0}^{\prime}(x)+\epsilon f_{1}^{\prime}(x)\right]^{2}}}\right|_{\epsilon=0} d x=\int_{x_{1}}^{x_{2}} \frac{f_{0}^{\prime}(x) f_{1}^{\prime}(x)}{\sqrt{1+\left[f_{0}^{\prime}(x)\right]^{2}}} d x=0$

此处可以使用分部积分法： $\int udv = uv -\int vdu$ 。令 $v=f_1(x)$ , $u=\frac{f_{0}^{\prime}(x)}{\sqrt{1+\left[f_{0}^{\prime}(x)\right]^{2}}}$ ，得到：
$\int_{x_{1}}^{x_{2}} f_{1}(x) \frac{d}{d x}\left[\frac{f_{0}^{\prime}(x)}{\sqrt{1+\left[f_{0}^{\prime}(x)\right]^{2}}}\right] d x=0$
这里使用了条件 $f_1(x1)=f_1(x2)=0$ 。由于对于任意 $f_1$ 都要有此结论，因此:
$\frac{d}{d x}\left[\frac{f_{0}^{\prime}(x)}{\sqrt{1+\left[f_{0}^{\prime}(x)\right]^{2}}}\right]=0$
化简终可得到：
$\frac{d^{2} f_{0}}{d x^{2}}=0$
也即， $f (x)$ 为直线。