从遇见你的那刻起,
我的世界开始改变。
从听到你的那句话,
我的信心开始萌芽。
我知道这份爱值得拥有,
我会在这里等待,
等待亲口说出那三个字。
——畅宝宝的傻逼哥哥
如果考虑的极值点类型(即极大值,极小值)位于可行域的内部,那么我们称为它们驻点,因为在这些点上 g(x)=0 ,还有一种驻点是鞍点。
定义1:
R
是可行域,我们称
- g(x¯)=0
- x¯ 既不是极大值,也不是极小值。
E2
中的鞍点如图1所示。
图1
鞍点
x¯
附近的任意点
x=x¯+αd∈R
,根据泰勒级数可得
其中
g(x¯)=0
。根据鞍点的定义,必须存在方向
d1,d2
使得
因为
x¯
既不是极小值也不是极大值,所以当
α→0
时我们有
因此,矩阵 H(x) 是不定的。
驻点是局部的并通过下面方法得到:
- 找出使得 g(xi¯)=0 的点 xi
- 求出海森矩阵 H(xi)
- 对于每个点 xi 确定 H(xi) 的特征
如果
H(xi)
是正(负)定的,那么
xi
是极小(大)值;如果
H(xi)
是不定的,那么
xi
是鞍点。如果
H(xi)
是半正(负)定的,那么
xi
可能是极小(大)值;如果
H(xi)=0
,那么
xi
可能是极大值也可能是极小值,因为必要条件都满足。很明显,如果
H(xi)
是半定的,那么我们没有充分的信息来判断驻点的特征,一个可行的方法是推导出
f(x)
的三阶导数,然后计算泰勒级数的第四项,如果这项等于零,那么就需要计算第五项,依次下去。另一种更实际的方法是计算
f(xi+ej),f(xj−ej)
,其中
j=1,2,…,n,ej
是一个向量,其元素为
然后判断是否满足极大值或极小值的定义。
通过前面的讨论可以看出,判别函数 f(x) 驻点的问题可以变成表征海森矩阵的问题,这个问题可以用下面的定理求解。
定理1:
实对称
n×n
矩阵
H
是正定,半正定等,如果对每个相同阶数的非奇异矩阵
B
,
给出的矩阵 H 是正定,半正定等。
证明:
如果
H
是正定,半正定等,那么对所有的
d≠0
因为
B
是非奇异的,
Bd=d̂
是非零向量,那么对所有
d≠0
,
因此
是正定,半正定等。
定理2:
- 如果
n×n
矩阵
B
是非奇异的且
Ĥ =BTHB
对称矩阵,对角元素为 h1^,h2^,…,hn^ ,那么 H 是正定,半正定,负定,半负定矩阵,如果对 i=1,2,…,n,ĥ i>0,≥0,≤0,<0 。否则的话,如果一些 ĥ i 是正的,一些是负的,那么 H 是不定的。
- (a)的逆也为真,即如果 H 是正定,半正定等,那么 ĥ i>0,≥0 等,如果 H 是不定的,那么某些 ĥ i 是正的,某些是负的。
证明:
(a)对所有
d≠0
因此如果
ĥ i>0,≥0
等,那么
即 Ĥ 是正定,半正定等。如果某些 ĥ i 是正的,一些是负的,那么我们能找到 d 产生正的或负的 dTĤ d ,那么 Ĥ 是不定的。接下来因为 Ĥ =BTHB ,根据上面的定理得到如果 ĥ i>0,≥0,ect ,那么 H 是正定,半正定等。
(b)假设
H
是正定,半正定等,因为
Ĥ =BTHB
,根据上面的定理可知
Ĥ
是正定,半正定等。如果
d
是一个向量,元素
dk
为
那么
如果 H 是不定的,根据上面的定理可知 Ĥ 是不定的,因此某些 ĥ i 必须为正,某些必须为负。
通过在矩阵
H
上执行行运算或列运算就能得到对角矩阵
Ĥ
,例如某行的k倍加到其他行,某列的k倍加到其他列,对于对称矩阵,这些运算通过应用初等变换就能实现,即
Ĥ
通过如下方式得到
其中
E1,E2,…
是初等矩阵,典型的初等矩阵如
与
如果
Ea
左乘一个
3×3
的矩阵,效果就是第二行的
k
倍加到第三行,如果
那么
因此
因为初等矩阵是非奇异的,所以
B
是非奇异的,故
另一个表征海森矩阵的定理如下:
定理3:
- 如果
H
是实对称矩阵,那么存在正交矩阵
U
使得
Λ=UTHU
是对角矩阵,其对角元素就是 H 的特征值。
- H 的特征值是实数。
对于实酉矩阵,我们有
UTU=In
,其中
是 n×n 单位矩阵,因此 detU=±1 ,即 U 是非奇异的。根据定理1,如果 H 是正定,半正定等,那么 Λ 是正定,半正定,因此 H 通过求出其特征值,然后检查它们的符号就能进行表征。
另一种表征方阵 H 的方法是基于它的主子式与顺序主子式,该方法的细节具体如下:
定理4:
- 如果
H
是半正定或正定矩阵,那么
detH≥0 or >0 - H 是正定矩阵,当且仅当其所有顺序主子式均为正,例如 detHi>0 for i=1,2,…,n
- H 是半正定矩阵,当且仅当其所有主子式均为正,例如对 {l1,l2,…,li} 所有可能的选择 detH(l)i≥0 for i=1,2,…,n
- H 是负定矩阵,当且仅当 −H 的所有顺序主子式均为正,例如 det(-Hi)>0 for i=1,2,…,n
- H 是半负定矩阵,当且仅当 −H 的所有主子式均为正,例如对 {l1,l2,…,li} 所有可能的选择 det(-H(l)i)≥0 for i=1,2,…,n
- H 是不定矩阵,如果(c)(e)都不满足。