多元函数泰勒展开与黑塞矩阵

最新推荐文章于 2024-04-22 10:24:27 发布

云端FFF

最新推荐文章于 2024-04-22 10:24:27 发布

阅读量2k

点赞数 3

分类专栏：数学 =========================== 文章标签：多元函数泰勒展开黑塞矩阵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wxc971231/article/details/119919650

版权

数学 =========================== 专栏收录该内容

9 篇文章 14 订阅

订阅专栏

文章目录

1. 引入：函数展开
2. 泰勒展开
3. 黑塞矩阵（海森矩阵）

1. 引入：函数展开

设函数 $y = f (x)$ 在点 $x_0$ 处可导，则在点 $x_0$ 的某邻域内，可以用下式表示原函数值
$f(x_0)+f'(x_0)(x - x_0) + o(x - x_0),\space\space\space x \rightarrow x_0$
对于这种一元函数，示意图如下
上面这个式子，可以看作在点 $x_0$ 处对 $f (x)$ 进行了一步展开，使用线性主部 $f'(x_0)(x - x_0)$ 和与展开点 $x_0$ 的偏差 $\triangle x$ 的高阶无穷小表示原函数。
函数展开的应用非常广泛，这种方法可以把复杂的原始目标函数近似转换为多项式函数，从而简化问题。使用泰勒展开，只要原函数任意阶可导，就可以将其展开为任意阶的多项式函数，得到更高精度的表示

2. 泰勒展开

2.1 一元函数泰勒展开

使用泰勒展开，可以把在 $x_k$ 处 $n$ 阶可导的函数 $f (x)$ 展开为关于 $\triangle x = x-x_k$ 的 $n$ 次多项式，如下
$\begin{aligned} f(x) &= f(x_k) + (x-x_k)f'(x_k)+\frac{1}{2!}(x-x_k)^2f''(x_k) + ... \\ &= \sum_{n=0}^\infin \frac{f^{(n)}(x_k)}{n!}(x-x_k)^n \end{aligned}$
当 $n$ 有上界时，需要在展开式最后添加 $\triangle x = (x-x_k)$ 的 $n$ 次方的高阶无穷小 $o((x-x_k)^n)$ 以补足近似差距，保证等号成立。可见，随着展开阶数提高，展开式精度也在不断提高

2.2 二元函数泰勒展开

记 $\triangle x = x-x_k,\space\space \triangle y = y-y_k$ ，设二元函数 $f (x, y)$ 在 $x_k,y_k)$ 处可导，可以如下展开：
$\begin{aligned} f(x,y) = f(x_k,y_k) &+ \Big[f'_x(x_k,y_k) \triangle x +f'_y(x_k,y_k)\triangle y\Big]\\ &+ \frac{1}{2!}\Big[f''_{xx}(x_k,y_k)\triangle x^2 + f''_{xy}(x_k,y_k)\triangle x\triangle y+f''_{yx}(x_k,y_k)\triangle x\triangle y+f''_{yy}(x_k,y_k)\triangle y^2 \Big] \\ &+ ... \end{aligned}$
通常写成矩阵形式
$\begin{aligned} f(x,y) = f(x_k,y_k) &+ \begin{bmatrix}f'_x(x_k,y_k)&f'_y(x_k,y_k)\end{bmatrix} \begin{bmatrix}\triangle x \\\triangle y\end{bmatrix} \\ &+ \frac{1}{2!}\begin{bmatrix}\triangle x &\triangle y\end{bmatrix} \begin{bmatrix}f''_{xx}f(x_k,y_k) &f''_{xy}f(x_k,y_k)\\f''_{yx}f(x_k,y_k) &f''_{yy}f(x_k,y_k)\end{bmatrix} \begin{bmatrix}\triangle x \\\triangle y\end{bmatrix} \\ &+... \end{aligned}$
以上展开到2阶，所以至少要求2阶可导，若二阶导数连续（原函数为光滑曲线），则有 $f''_{xy}=f''_{yx}$ ，可进一步化简

2.3 n元函数泰勒展开

记 $\triangle x^i = x-x_k^i$ ，设 $\pmb{x} = (x^1,x^2,...,x^n)^T$ ， $n$ 元函数 $f(\pmb{x})$ 在 $\pmb{x}_k = (x_k^1,x_k^2,...,x_k^n)^T$ 处可导，可以如下展开：
$\begin{aligned} f(\pmb{x}) = f(\pmb{x}_k) &+ \sum_{i=1}^n f'_{x^i}(\pmb{x}) \triangle x^i \\ &+ \frac{1}{2!} \sum_{i,j=1}^nf''_{ij}(\pmb{x}_k)(x^i-x^i_k)\\ &+ ... \end{aligned}$
通常写成矩阵形式
$\begin{aligned} f(\pmb{x}) = f(\pmb{x}_k) &+ \begin{bmatrix}f'_{x^1}(\pmb{x}_k)&f'_{x^2}(\pmb{x}_k) &\dots &f'_{x^n}(\pmb{x}_k)\end{bmatrix} \begin{bmatrix}\triangle x^1 \\\triangle x^2 \\ \vdots\\ \triangle x^n \end{bmatrix} \\ &+ \frac{1}{2!}\begin{bmatrix}\triangle x^1 &\triangle x^2 & \dots & \triangle x^n \end{bmatrix} \pmb{H}(\pmb{x}_k) \begin{bmatrix}\triangle x^1 \\\triangle x^2 \\ \vdots\\ \triangle x^n \end{bmatrix}\\ &+ ... \end{aligned}$
其中 $\begin{bmatrix}f'_{x^1}(\pmb{x}_k)&f'_{x^2}(\pmb{x}_k) &\dots &f'_{x^n}(\pmb{x}_k)\end{bmatrix}$ 就是 $f(\pmb{x})$ 的梯度，化简符号如下：
$\begin{aligned} f(\pmb{x}) = f(\pmb{x}_k) &+ [\triangledown f(\pmb{x}_k)]^T[\pmb{x}-\pmb{x}_k] \\ &+ \frac{1}{2!}[\pmb{x}-\pmb{x}_k]^T H(\pmb{x}_k) [\pmb{x}-\pmb{x}_k]\\ &+ ... \end{aligned}$
以上展开到2阶，所以至少要求2阶可导，若二阶导数连续（原函数为光滑曲线），则有 $f''_{xy}=f''_{yx}$ ，可进一步化简。上式中 $H(\pmb{x}_k)$ 是黑塞矩阵，当展开到二阶时就会出现

3. 黑塞矩阵（海森矩阵）

黑塞矩阵是由某个多元函数的二阶偏导数构成的方阵，描述了函数的局部曲率

黑塞矩阵常用于牛顿法解决优化问题，利用黑塞矩阵可判定多元函数的极值问题。在工程实际问题的优化设计中，所列的目标函数往往很复杂，为了使问题简化，常常将目标函数在某点邻域展开成泰勒多项式来逼近原函数，此时函数在某点泰勒展开式的矩阵形式中会涉及到黑塞矩阵
在 2.3 节设定下，黑塞矩阵为
对称性：要求 $f(\pmb{x})$ 在展开区域内二阶连续可导（二阶偏导数连续，原函数光滑），则原函数的混合偏导数相等，黑塞矩阵成为对称矩阵
可以使用黑塞矩阵判断多元函数极值，这个以后的文章再详细分析

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

云端FFF 所有博文免费阅读，求打赏鼓励~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。