曲面与极值总结

YiPeng_Deng

于 2022-04-08 09:12:32 发布

阅读量1.1k

点赞数 1

分类专栏：总结反思

本文链接：https://blog.csdn.net/qq_43649416/article/details/124032938

版权

数学微积分曲面极值

总结反思专栏收录该内容

87 篇文章 3 订阅

订阅专栏

曲面的切平面和法线

显示表示 $z = f (x, y)$ ：

切平面： $z=z_0+\frac{\partial f}{\partial x}(x_0,y_0)(x-x_0)+\frac{\partial f}{\partial y}(x_0,y_0)(y-y_0)$
- $z=z_0+Df(x_0,y_0)(x-x_0,y-y_0)$ 相当于在 $x_0,y_0)$ 泰勒展开一阶
法向量： $n=\big(\frac{\partial f}{\partial x},\frac{\partial f}{\partial y},-1\big)$ ，即上式中 $x-x_0),(y-y_0),(z-z_0)$ 前的参数，使得内积为 $0$
法线： $x_0,y_0,z_0)+kn$ ，或者写作

$\frac{x-x_0}{\frac{\partial f}{\partial x}(x_0,y_0)}=\frac{y-y_0}{\frac{\partial f}{\partial y}(x_0,y_0)}=\frac{z-z_0}{-1}$

隐式表示 $F (x, y, z) = 0$

切平面： $\frac{\partial F}{\partial x}(x-x_0)+\frac{\partial F}{\partial y}(y-y_0)+\frac{\partial F}{\partial z}(z-z_0)=0$
- $DF(x_0,y_0,z_0)(x-x_0,y-y_0,z-z_0)=0$
- 即 $x_0,y_0,z_0)$ 的微分作用在增量 $x-x_0,y-y_0,z-z_0)$ 上不会改变 $F$
- 那么在这一平面上上近似于曲面 $F = 0$
法向量： $n=\big(\frac{\partial F}{\partial x},\frac{\partial F}{\partial y},\frac{\partial F}{\partial z}\big)$
- 为 $F$ 的梯度， $F$ 沿梯度上升最快，因此与 $F$ 恒等于 $0$ 正交
法线：

$\frac{x-x_0}{\frac{\partial f}{\partial x}(x_0,y_0)}=\frac{y-y_0}{\frac{\partial f}{\partial y}(x_0,y_0)}=\frac{z-z_0}{\frac{\partial f}{\partial z}(x_0,y_0)}$

参数表示 $(x, y, z) = (x (u, v), y (u, v), z (u, v)) = F (u, v)$

切平面参数表示：
$x-x_0=\frac{\partial x}{\partial u}(u_0,v_0)(u-u_0)+\frac{\partial x}{\partial v}(u_0,v_0)(v-v_0)\\ y-y_0=\frac{\partial y}{\partial u}(u_0,v_0)(u-u_0)+\frac{\partial y}{\partial v}(u_0,v_0)(v-v_0)\\ z-z_0=\frac{\partial z}{\partial u}(u_0,v_0)(u-u_0)+\frac{\partial z}{\partial v}(u_0,v_0)(v-v_0)$
- 对 $x, y, z$ 每个方向关于 $(u, v)$ 求切线（一阶泰勒展开）
上式对于 $X = (x, y, z)$ 也可以写成： $X-X_0=\frac{\partial X}{\partial u}(u_0,v_0)*k_1+\frac{\partial X}{\partial v}(u_0,v_0)*k_2$
通过叉乘求出法向量为（ $i, j, k$ 分别为 $x, y, z$ 的基，其系数即该坐标分量的大小）

$\begin{vmatrix} i & j & k\\ \frac{\partial x}{\partial u} & \frac{\partial y}{\partial u} & \frac{\partial z}{\partial u}\\ \frac{\partial x}{\partial v} & \frac{\partial y}{\partial v} & \frac{\partial z}{\partial v} \end{vmatrix}$

切平面： $\left< n,X\right>=0$
对于一般的情况，法空间 $N(JF^T(u_0,v_0))$ ，即切空间 $R(JF(u_0,v_0))$ 的正交补

简单总结：

显式表达可以看作隐式表达，隐式表达下：
- 法向量为梯度向量，对于坐标求偏导
- 切平面方程由法向量得到
参数表达下：
- 切平面的参数方程，对于参数求偏导
- 根据维数：
  - 法向量关于参数 $u, v$ 对应的 $D_uX(u),D_vX(v)$ 求叉乘
  - 法平面由切平面求正交补得到（解零空间）
- 切平面方程可由法空间得到
两者之间有明显的对偶关系

极值

极值定义

存在小邻域内所有点函数值都小于该点的函数值为极大值（根据小于或小于等于判断是否严格）
只能在内点讨论极值

临界点

$\nabla f(x_0)=df(x_0)=0$ ，即一阶微分为0，类似一元函数导数为0

非退化临界点

$H_f(x_0)$ 可逆
$H_f(x_0)$ 正定即极小值，负定即极大值
都不是则有正、负特征值，该点为鞍点
由泰勒展开得到上述结论： $f(x_0+v)=f(x)+v^TH_f(x_0)v+o(\Vert v\Vert^2)$

一般函数求极值：

解法一：
- 求出所有临界点
- 如果临界点都是非退化临界点则直接求 $H e s s e$ 矩阵判断正定性（顺序主子式为正数）
- 对于退化临界点讨论周围的点的 $H e s s e$ 矩阵
解法二：

条件极值

在满足 $F_k(x)=0,k=1,2,...,n$ 的所有 $x\in \R ^m$ 中求 $f (x)$ 的极值

若对于 $F=(F_1,F_2,...,F_n)$ ， $DF(x^*)$ 满行秩则可以根据隐函数定理得到 $F (x) = 0$ 是 $m - n$ 维曲面

必要条件

$\nabla f(x^*)\perp \ker DF(x^*)$
- 即 $f (x)$ 增长方向与 $F (x) = 0$ 曲面的切平面垂直
- 否则可以沿 $\nabla f(x^*)$ 在切平面的投影方向得到更大值）
$DF(x^*)$ 满行秩则 $\nabla F_k(x^*)$ 为 $ker DF(x^*)$ 一组基
则 $\nabla f(x^*)=\sum \lambda_i\nabla F_i(x^*)$

对于必要条件，可以使用拉格朗日乘子法

$L(x,\lambda_1,...,\lambda_n)=f(x)-\lambda_1F_1(x)-...-\lambda_nF_n(x)$
$(x^*,\lambda_1^*,...,\lambda_n^*)$ 是 $L$ 的临界点：
- $0=\nabla L(x^*,\lambda_1^*,...,\lambda_n^*)=\begin{pmatrix}\nabla f(x^*)-\sum_{k=1}^n\lambda_k\nabla F_k(x^*)\\-F_1(x^*)\\ \vdots \\ -F_n(x^*)\end{pmatrix}$
- 上一行的列向量中，第一个元素是 $m$ 维列向量，即对 $x$ 求偏导在 $x^*$ 处取，实际上是对 $x_1...x_m$ 求 $m$ 个偏导分别为0
- $\partial_{x} L(x^*,\lambda)$ 是 $L$ 在 $(x^*,\lambda)$ 处的微分，是 $1 * m$ 的 $J a c o b i$ 矩阵，是 $\nabla L$ 前 $m$ 行对应列向量的转置，是 $L$ 分别对前 $m$ 个分量求偏导数组合起来的列向量
记 $H=d^2f(x^*)-(\lambda_1,...,\lambda _n)D^2F(x^*)$
- 在 $F(x^*)$ 的切平面上 $H$ 正定为极小值，负定为极大值，
- 同时有正负特征值时不是极值点