lecture05:Positive Definite and Semidefinite Matrices——正定、半正定矩阵
补充:【线性代数】6-5:正定矩阵(Positive Definite Matrices) | 谭升的博客 https://face2ai.com/Math-Linear-Algebra-Chapter-6-5/
对称正定矩阵
讨论满足条件:
-
对称矩阵,特征值 λ i > 0 \lambda_i>0 λi>0
-
充要条件: x T S x > 0 ( x ≠ 0 ) x^TSx>0(x\neq0) xTSx>0(x=0);另一种理解,关于能量的 x T S x > x^TSx> xTSx> 表示一个系统的能量,其必须大于0,也就是说对于一个矩阵,其能量为正,这个矩阵定义为正定矩阵。
-
S = A T A , A S=A^TA,A S=ATA,A列向量无关
-
子行列式>0
-
消元后的主元 p i v o t s > 0 pivots>0 pivots>0
S = [ 3 4 4 5 ] , d e t < 0 × S=\left[\begin{matrix}3&4\\4&5\end{matrix}\right],det<0\ × S=[3445],det<0 ×
S = [ 3 4 4 6 ] → [ 3 4 0 2 / 3 ] , p i v o t s > 0 ( 主 元 乘 积 = 行 列 式 值 ) S=\left[\begin{matrix}3&4\\4&6\end{matrix}\right]\ →\left[\begin{matrix}3&4\\0&2/3\end{matrix}\right],pivots>0(主元乘积=行列式值) S=[3446] →[3042/3],pivots>0(主元乘积=行列式值)
[ x y ] [ 3 4 4 6 ] [ x y ] = 3 x 2 + 6 y 2 + 8 x y = 3 ( x + 4 3 y ) 2 + 2 3 y 2 > = 0 \left[\begin{matrix}x&y\end{matrix}\right]\left[\begin{matrix}3&4\\4&6\end{matrix}\right]\left[\begin{matrix}x\\y\end{matrix}\right]=3x^2+6y^2+8xy=3(x+\frac{4}{3}y)^2+\frac{2}{3}y^2>=0 [xy][3446][xy]=3x2+6y2+8xy=3(x+34y)2+32y2>=0
以上 L ( x , y ) = x T S x L(x,y)=x^TSx L(x,y)=xTSx是一个碗的形状( x , y ≠ 0 x,y\neq0 x,y=0),为凸函数,梯度下降可得到局部最优解即全局最优解;而 L ( x , y ) = x T S x + x T b L(x,y)=x^TSx+x^Tb L(x,y)=xTSx+xTb,局部最优解不一定是全局最优,存在问题。
正定矩阵的可加性:两个正定矩阵之和仍为正定矩阵
x T s x > 0 , x T T x > 0 → x T ( S x + T x ) = x T ( S + T ) x = x T C x > 0 x^Tsx>0\ ,x^TTx>0\ →x^T(Sx+Tx)=x^T(S+T)x=x^TCx>0 xTsx>0 ,xTTx>0 →xT(Sx+Tx)=xT(S+T)x=xTCx>0
正定矩阵的可逆性:正定矩阵的逆仍为正定矩阵,特征值为 1 λ \frac{1}{\lambda} λ1
Q T S Q : Q T S Q = Q − 1 S Q , 相 似 矩 阵 , 特 征 值 相 同 或 者 x T Q T S Q x = y T S y , 仍 为 正 定 Q^TSQ:Q^TSQ=Q^{-1}SQ,相似矩阵,特征值相同或者x^TQ^TSQx=y^TSy,仍为正定 QTSQ:QTSQ=Q−1SQ,相似矩阵,特征值相同或者xTQTSQx=yTSy,仍为正定
半正定矩阵
讨论满足条件:
- 特征值 λ i ≥ 0 \lambda_i\geq0 λi≥0
- x T S x ≥ 0 x^TSx\geq0 xTSx≥0
- S = A T A , 允 许 A S=A^TA,允许A S=ATA,允许A列向量相关
- 行列式 ≥ 0 \geq0 ≥0
- r 个 p i v o t s > 0 , r ≤ n r个pivots>0,r\leq n r个pivots>0,r≤n
S = [ 3 4 4 16 3 ] , d e t = 0 , t r a c e = 3 + 16 3 , λ = 0 / 25 3 S=\left[\begin{matrix}3&4\\4&\frac{16}{3}\end{matrix}\right],det=0,trace=3+\frac{16}{3},\lambda=0/\frac{25}{3} S=[344316],det=0,trace=3+316,λ=0/325
S = [ 1 1 1 1 1 1 1 1 1 ] , r = 1 , λ = 3 / 0 / 0 S=\left[\begin{matrix}1&1&1\\1&1&1\\1&1&1\end{matrix}\right],r=1,\lambda=3/0/0 S=⎣⎡111111111⎦⎤,r=1,λ=3/0/0
S = [ 1 1 1 1 1 1 1 1 1 ] = Q Λ Q T = λ 1 q 1 q 1 T + λ 2 q 2 q 2 T + λ 3 q 3 q 3 T = λ 1 q 1 q 1 T = 3 ∗ 1 3 [ 1 1 1 ] 1 3 [ 1 1 1 ] S=\left[\begin{matrix}1&1&1\\1&1&1\\1&1&1\end{matrix}\right]=Q\Lambda Q^T=\lambda_1q_1q_1^T+\lambda_2q_2q_2^T+\lambda_3q_3q_3^T=\lambda_1q_1q_1^T=3*\frac{1}{\sqrt{3}}\left[\begin{matrix}1&1&1\end{matrix}\right]\frac{1}{\sqrt{3}}\left[\begin{matrix}1\\1\\1\end{matrix}\right] S=⎣⎡111111111⎦⎤=QΛQT=λ1q1q1T+λ2q2q2T+λ3q3q3T=λ1q1q1T=3∗31[111]31⎣⎡111⎦⎤