线性代数(八)：二次型（续）

最新推荐文章于 2022-12-21 19:19:55 发布

Albert M

最新推荐文章于 2022-12-21 19:19:55 发布

阅读量546

点赞数 3

分类专栏：线性代数文章标签：线性代数矩阵

本文链接：https://blog.csdn.net/qq_51453181/article/details/126078481

版权

线性代数专栏收录该内容

9 篇文章 1 订阅

订阅专栏

二次型（续）

由惯性定理很容易得到如下推论：
推论8.2：任何实二次型均可经过非退化的线性变换化为规范形且规范形是唯一的。即，任意实对称矩阵必合同于如下形式的对角矩阵: $D_{n}=\begin{bmatrix} 1\\ &1\\ &&\ddots\\ &&&1\\ &&&&-1\\ &&&&&\ddots\\ &&&&&&-1\\ &&&&&&&0\\ &&&&&&&&\ddots\\ &&&&&&&&&0\end{bmatrix}_{n\times n}\qquad(1)$

Remark:
问：惯性定理只保证了对角元素 $1$ 或 $- 1$ 的个数相同，并没有确定其次序的问题，那怎么能确保一定能合同于上述形式呢？
答： $- 1 与 1$ 的任意次序可通过对称行列初等变换来交换对角元素的位置，而变化前后的两个对角阵满足合同关系的定义式，即对称行初等变换不影响合同关系，由合同的传递性即可得出上述命题的正确性。

定义8.6:实二次型的标准形中正平方项的个数 $p$ 称作 正惯性指数，负平方项的个数 $q$ 称作 负惯性指数，二者的差 $(p - q)$ 称作 符号差。

推论8.3：实对称矩阵 $A\simeq B\Longleftrightarrow r(A)=r(B)$ 且二者正惯性指数相同 $\Longleftrightarrow A、B$ 的正、负特征值个数分别相同
证明：若 $A\simeq B$ ，则 $r (A) = r (B)$
$\quad\ \ \quad$ 由推论8.2：存在规范形对角阵使得： $A\simeq D_{n}$ ( $D_{n}$ 如(1)式定义)
$\quad\ \ \quad$ 则， $B\simeq D_{n}$
$\quad\ \ \quad$ 显然，二者正惯性指数也应相同。
$\quad\ \ \quad$ 反过来，若 $r (A) = r (B)$ 且二者正惯性指数相同
$\quad\ \ \quad$ 那么， $A 、 B$ 有相同的规范形矩阵 $D_{n}$
$\quad\ \ \quad$ 即， $A\simeq D_{n}$ ， $B\simeq D_{n}$ 则 $A\simeq B$

$\quad\ \ \quad$ 实对称矩阵可合同于由特征值构成的标准形对角矩阵，即 $A\simeq D_{A}$ , $B\simeq D_{B}$
$\quad\ \ \quad$ 若 $A\simeq B$ ，则 $D_{A}\simeq D_{B}$
$\quad\ \ \quad$ 那么 $r(D_A)=r(D_B)$ 且 $D_{A}，D_{B}$ 的正惯性指数相同
$\quad\ \ \quad$ 则, $A 、 B$ 的正、负特征值个数均分别相同。
$\quad\ \ \quad$ 反之，若 $A 、 B$ 的正、负特征值个数均相同
$\quad\ \ \quad$ 那么， $A 、 B$ 各自的标准形对角阵的正负对角元素个数分别相同。
$\quad\ \ \quad$ 又，标准形对角阵总可经过非退化线性变换为规范形对角阵
$\quad\ \ \quad$ 则， $A, B$ 合同于相同的规范形，故 $A\simeq B$ 。

定义8.7:
(1) 若实二次型 $f=\vec{X}^TA\vec{X}$ 对任意非零 $\vec{X}\in R^n$ 均为正，则该二次型称为 正定二次型， $A$ 称作 正定矩阵；
(2) 若实二次型 $f=\vec{X}^TA\vec{X}$ 对任意非零 $\vec{X}\in R^n$ 均为负，则该二次型称为 负定二次型， $A$ 称作 负定矩阵；
(3) 若实二次型 $f=\vec{X}^TA\vec{X}$ 对任意非零 $\vec{X}\in R^n$ 均非负，则该二次型称为 半正定二次型， $A$ 称作 半正定矩阵；
(4) 若实二次型 $f=\vec{X}^TA\vec{X}$ 对任意非零 $\vec{X}\in R^n$ 均非正，则该二次型称为 半负定二次型， $A$ 称作 半负定矩阵；
(5) 若实二次型 $f=\vec{X}^TA\vec{X}$ 既不是半正定也不是半负定二次型，则称该二次型不定。

定理8.4：
（1） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 正定 $\Longleftrightarrow$ $A$ 的正惯性指数等于 $r (A) = n$ ；
（2） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 负定 $\Longleftrightarrow$ $A$ 的负惯性指数等于 $r (A) = n$ ；
（3） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 半正定 $\Longleftrightarrow$ $A$ 的正惯性指数等于 $r (A)$ ；
（4） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 半负定 $\Longleftrightarrow$ $A$ 的负惯性指数等于 $r (A)$ 。

通过非退化线性变换 $\vec{X}=P\vec{Y}$ ，任意实二次型均可化为标准形: $f=\vec{X}^TA\vec{X}=d_1y_1^2+d_2y_2^2+\dots+d_ny_n^2，（d_i\in R，i=1,\dots,n）$
(1) 证明：
充分性：
若该实二次型正定，则对任意 $\vec{X}\ne0$ 均有 $f > 0$ ,不妨取: $\vec{X}_i=P\vec{e}_i\qquad(i=1,2,\dots,n)$ 则 $\vec{Y}_i=P^{-1}\vec{X}_i=\vec{e}_i\qquad(i=1,2,\dots,n)$ 那么将 $\vec{Y}_i$ 分别代入二次型可得： $d_i>0\qquad(i=1,2,\dots,n)$ 即 $A$ 的正惯性指数等于 $n$ ，且 $r (A) = n$ .
必要性：
若 $A$ 的正惯性指数等于 $r (A) = n$ ，即 $d_i>0\qquad(i=1,2,\dots,n)$
则对任意 $\vec{X}\ne0$ ，均有 $\vec{Y}=P^{-1}\vec{X}\ne0$ ，使得 $f(\vec{X})=d_1y_1^2+d_2y_2^2+\dots+d_ny_n^2>0$ 满足二次型正定的定义。（证毕）
(2) 证明：
充分性：
若该实二次型负定，则对任意 $\vec{X}\ne0$ 均有 $f < 0$ ,不妨取: $\vec{X}_i=P\vec{e}_i\qquad(i=1,2,\dots,n)$ 则 $\vec{Y}_i=P^{-1}\vec{X}_i=\vec{e}_i\qquad(i=1,2,\dots,n)$ 那么将 $\vec{Y}_i$ 分别代入二次型可得： $d_i<0\qquad(i=1,2,\dots,n)$ 即 $A$ 的负惯性指数等于 $n$ ，且 $r (A) = n$ .
必要性：
若 $A$ 的负惯性指数等于 $r (A) = n$ ，即 $d_i<0\qquad(i=1,2,\dots,n)$
则对任意 $\vec{X}\ne0$ ，均有 $\vec{Y}=P^{-1}\vec{X}\ne0$ ，使得 $f(\vec{X})=d_1y_1^2+d_2y_2^2+\dots+d_ny_n^2<0$ 满足二次型负定的定义。（证毕）
(3) 证明：
充分性：
若该实二次型半正定，则对任意 $\vec{X}\ne0$ 均有 $f\ge0$ ,不妨取: $\vec{X}_i=P\vec{e}_i\qquad(i=1,2,\dots,n)$ 则 $\vec{Y}_i=P^{-1}\vec{X}_i=\vec{e}_i\qquad(i=1,2,\dots,n)$ 那么将 $\vec{Y}_i$ 分别代入二次型可得： $d_i\ge0\qquad(i=1,2,\dots,n)$ 即不存在负惯性指数，则正惯性指数即为 $r (A)$ .
必要性：
若 $A$ 的正惯性指数等于 $r (A)$ ，即不存在负惯性指数， $d_i\ge0\qquad(i=1,2,\dots,n)$
则对任意 $\vec{X}\ne0$ ，均有 $\vec{Y}=P^{-1}\vec{X}\ne0$ ，使得 $f(\vec{X})=d_1y_1^2+d_2y_2^2+\dots+d_ny_n^2\ge0$ 满足二次型半正定的定义。（证毕）
(4) 证明：
充分性：
若该实二次型半负定，则对任意 $\vec{X}\ne0$ 均有 $f\le0$ ,不妨取: $\vec{X}_i=P\vec{e}_i\qquad(i=1,2,\dots,n)$ 则 $\vec{Y}_i=P^{-1}\vec{X}_i=\vec{e}_i\qquad(i=1,2,\dots,n)$ 那么将 $\vec{Y}_i$ 分别代入二次型可得： $d_i\le0\qquad(i=1,2,\dots,n)$ 即不存在正惯性指数，则负惯性指数即为 $r (A)$ .
必要性：
若 $A$ 的负惯性指数等于 $r (A)$ ，即不存在正惯性指数， $d_i\le0\qquad(i=1,2,\dots,n)$
则对任意 $\vec{X}\ne0$ ，均有 $\vec{Y}=P^{-1}\vec{X}\ne0$ ，使得 $f(\vec{X})=d_1y_1^2+d_2y_2^2+\dots+d_ny_n^2\le0$ 满足二次型半负定的定义。（证毕）

推论8.4：
（1）实对称矩阵 $A$ 正定 $\Longleftrightarrow$ 存在可逆矩阵 $P$ 使得 $P^TAP=E$ ;
（2）实对称矩阵 $A$ 负定 $\Longleftrightarrow$ 存在可逆矩阵 $P$ 使得 $P^TAP=-E$ ;
（3）实对称矩阵 $A$ 半正定 $\Longleftrightarrow$ 存在可逆矩阵 $P$ 使得 $P^TAP=\begin{bmatrix}E_{r(A)\times r(A)}&0\\0&0\end{bmatrix}$ ;
（4）实对称矩阵 $A$ 半负定 $\Longleftrightarrow$ 存在可逆矩阵 $P$ 使得 $P^TAP=\begin{bmatrix}-E_{r(A)\times r(A)}&0\\0&0\end{bmatrix}$ .

推论8.5：
(1) 正定矩阵 $A$ 的行列式为正；
(2) 奇数阶负定矩阵 $A$ 的行列式为负；偶数阶负定矩阵 $A$ 的行列式为正，即 $(-1)^ndet(A_{n\times n})>0$ ；
(3) 半正定矩阵行列式为非负；
(4) 偶数阶半负定矩阵行列式为非负，奇数阶半负定矩阵行列式为非正，即 $(-1)^ndet(A_{n\times n})\ge0$ 。

推论8.6：
（1） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 正定 $\Longleftrightarrow$ $A$ 的特征值均为正；
（2） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 负定 $\Longleftrightarrow$ $A$ 的特征值均为负；
（3） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 半正定 $\Longleftrightarrow$ $A$ 的特征值非负；
（4） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 半负定 $\Longleftrightarrow$ $A$ 的特征值非正。

任意实二次型均可通过正交变换 $\vec{X}=C\vec{Y}$ ，化为标准形: $f=\vec{X}^TA\vec{X}=\lambda_1y_1^2+\lambda_2y_2^2+\dots+\lambda_ny_n^2，（\lambda_i\in R为A的特征值，i=1,\dots,n）$ 由定理8.4：可得推论8.6的成立。
由推论8.6还可进一步验证推论8.5的正确性，此外还可得知：

推论8.7：
(1) 正定矩阵 $A$ 的迹为正；
(2) 负定矩阵 $A$ 的迹为负；
(3) 半正定矩阵 $A$ 的迹为非负；
(4) 半负定矩阵 $A$ 的迹为非正。

定义8.8：设 $A$ 为实对称矩阵，则顺序取前 $k$ 行、前 $k$ 列交叉处的元素构成的 $k$ 阶对称方阵 $A_k$ 称为 $A$ 的 $k$ 阶顺序主子阵，而 $det(A_k)$ 称作其 k阶顺序主子式.
定义8.8：设 $A$ 为实对称矩阵，则任取 $k$ 行并对应取 $k$ 列，交叉处的元素构成的 $k$ 阶对称方阵 $A_k$ 称为 $A$ 的 $k$ 阶主子阵，而 $det(A_k)$ 称作其 k阶主子式.

定理8.5：（Sylvester定理）
（1） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 正定 $\Longleftrightarrow$ $A$ 的所有顺序主子式为正；
（2） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 负定 $\Longleftrightarrow$ $A$ 的所有顺序主子式满足 $1)^kdet(A_k)>0$ （奇数阶为负，偶数阶为正）；
（3） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 半正定 $\Longleftrightarrow$ $A$ 的所有主子式非负；
（4） $n$ 元实二次型 $f=\vec{X}^TA\vec{X}$ 半负定 $\Longleftrightarrow$ $A$ 的所有主子式满足 $(-1)^kdet(A_k)\ge0$ （奇数阶为非正，偶数阶为非负）

(1) 证明：
必要性：
若实二次型正定，则对任意非零 $\vec{X}\in R^n$ ,均使得二次型为正，不妨取 $\vec{X}_k=[x_1,x_2,x_3,\dots,x_k,0,0,\dots,0]_{1\times n}^T，其中1\le k\le n，x_1、x_2、x_3、\dots、x_k\in R$ 带入二次型则有： $f(x'_1,x'_2,x'_3,\dots,x'_n)=\sum_{i,j=1}^na_{ij}x'_ix'_j=f(x_1,x_2,x_3,\dots,x_k,0,0,\dots,0)=\sum_{i,j=1}^ka_{ij}x_ix_j=[x_1,x_2,x_3,\dots,x_k]A_k\begin{bmatrix}x_1\\x_2\\x_3\\\vdots\\x_k\end{bmatrix}对任意非零[x_1,x_2,x_3,\dots,x_k]^T\in R^k恒为正$ 说明 $A$ 的 $k$ 阶顺序主子阵 $A_k$ 也为正定矩阵，那么 $det(A_k)>0$ .
充分性：（数学归纳法）
当 $n = 1$ 时， $f=a_{11}x_1^2$ 又 $a_{11}>0$ ,则 $f$ 正定；
假设对任意的 $n - 1$ 元实二次型均成立，即各阶顺序主子式为正的 $n - 1$ 阶实对称矩阵为正定矩阵
下面讨论各阶顺序主子式为正的 $n$ 阶实对称矩阵 $A$ 的正定性：
进行矩阵分块： $A_n=\begin{bmatrix}A_{n-1}&a\\a^T&a_{nn}\end{bmatrix}$ 由于 $A_{n-1}$ 的各阶顺序主子式均是 $A$ 的各阶顺序主子式，则 $A_{n-1}$ 正定，即 $\exists可逆矩阵P_1\ s.t.\ P_1^TA_{n-1}P_1=E_{n-1}$ 不妨取可逆矩阵 $Q_1=\begin{bmatrix}P_1&0\\0&1\end{bmatrix}$ 则 $Q_1^TAQ_1=\begin{bmatrix}P_1&0\\0&1\end{bmatrix}^T \begin{bmatrix}A_{n-1}&a\\a^T&a_{nn}\end{bmatrix} \begin{bmatrix}P_1&0\\0&1\end{bmatrix} =\begin{bmatrix}P_1^TA_{n-1}P_1&P_1^Ta\\a^TP_1&a_{nn}\end{bmatrix} =\begin{bmatrix}E_{n-1}&P_1^Ta\\a^TP_1&a_{nn}\end{bmatrix}$ 进一步取可逆矩阵 $Q_2=\begin{bmatrix}E_{n-1}&-P_1^Ta\\0&1\end{bmatrix}$ 则 $Q_2^TQ_1^TAQ_1Q_2 =\begin{bmatrix}E_{n-1}&-P_1^Ta\\0&1\end{bmatrix}^T \begin{bmatrix}E_{n-1}&P_1^Ta\\a^TP_1&a_{nn}\end{bmatrix} \begin{bmatrix}E_{n-1}&-P_1^Ta\\0&1\end{bmatrix} =\begin{bmatrix}E_{n-1}&0\\0&a_{nn}-a^TP_1P_1^Ta\end{bmatrix} =\begin{bmatrix}E_{n-1}&0\\0&b\end{bmatrix}$ 由上式有 $det(Q_1Q_2)^2det(A)=b=a_{nn}-a^TP_1P_1^Ta>0$ 故取可逆矩阵 $Q_3=\begin{bmatrix}E_{n-1}&0\\0&\frac{1}{\sqrt{b}}\end{bmatrix}$ 则 $Q_3^TQ_2^TQ_1^TAQ_1Q_2Q_3=E$ 意味着若 $n$ 阶方阵 $A$ 的顺序主子式均为正，则其可合同于单位阵，故其正定。（证毕）

(2) 证明：
必要性：
若实二次型负定，则对任意非零 $\vec{X}\in R^n$ ,均使得二次型为负，不妨取 $\vec{X}_k=[x_1,x_2,x_3,\dots,x_k,0,0,\dots,0]_{1\times n}^T，其中1\le k\le n，x_1、x_2、x_3、\dots、x_k\in R$ 带入二次型则有： $f(x'_1,x'_2,x'_3,\dots,x'_n)=\sum_{i,j=1}^na_{ij}x'_ix'_j=f(x_1,x_2,x_3,\dots,x_k,0,0,\dots,0)=\sum_{i,j=1}^ka_{ij}x_ix_j=[x_1,x_2,x_3,\dots,x_k]A_k\begin{bmatrix}x_1\\x_2\\x_3\\\vdots\\x_k\end{bmatrix}对任意非零[x_1,x_2,x_3,\dots,x_k]^T\in R^k恒为负$ 说明 $A$ 的 $k$ 阶顺序主子阵 $A_k$ 也为负定矩阵，那么 $1)^kdet(A_k)>0$ .
充分性：（数学归纳法）
当 $n = 1$ 时， $f=a_{11}x_1^2$ 又 $a_{11}<0$ ,则 $f$ 负定；
假设对任意的 $n - 1$ 元实二次型均成立，即：
任意奇数阶顺序主子式为负、偶数阶为正的 $n - 1$ 阶实对称矩阵为负定矩阵
下面讨论任意奇数阶顺序主子式为负、偶数阶为正的 $n$ 阶实对称矩阵 $A$ 的正定性：
进行矩阵分块： $A_n=\begin{bmatrix}A_{n-1}&a\\a^T&a_{nn}\end{bmatrix}$ 由于 $A_{n-1}$ 的各阶顺序主子式均是 $A$ 的各阶顺序主子式，则 $A_{n-1}$ 负定，即 $\exists可逆矩阵P_1\ s.t.\ P_1^TA_{n-1}P_1=-E_{n-1}$ 不妨取可逆矩阵 $Q_1=\begin{bmatrix}P_1&0\\0&1\end{bmatrix}$ 则 $Q_1^TAQ_1=\begin{bmatrix}P_1&0\\0&1\end{bmatrix}^T \begin{bmatrix}A_{n-1}&a\\a^T&a_{nn}\end{bmatrix} \begin{bmatrix}P_1&0\\0&1\end{bmatrix} =\begin{bmatrix}P_1^TA_{n-1}P_1&P_1^Ta\\a^TP_1&a_{nn}\end{bmatrix} =\begin{bmatrix}-E_{n-1}&P_1^Ta\\a^TP_1&a_{nn}\end{bmatrix}$ 进一步取可逆矩阵 $Q_2=\begin{bmatrix}E_{n-1}&P_1^Ta\\0&1\end{bmatrix}$ 则 $Q_2^TQ_1^TAQ_1Q_2 =\begin{bmatrix}E_{n-1}&P_1^Ta\\0&1\end{bmatrix}^T \begin{bmatrix}-E_{n-1}&P_1^Ta\\a^TP_1&a_{nn}\end{bmatrix} \begin{bmatrix}E_{n-1}&P_1^Ta\\0&1\end{bmatrix} =\begin{bmatrix}-E_{n-1}&0\\0&a_{nn}+a^TP_1P_1^Ta\end{bmatrix} =\begin{bmatrix}-E_{n-1}&0\\0&b\end{bmatrix}$ 由上式有 $det(Q_1Q_2)^2det(A)=b=a_{nn}+a^TP_1P_1^Ta\begin{cases}为正\qquad(A为偶数阶方阵)\\为负\qquad(A为奇数阶方阵)\end{cases}$ 故取可逆矩阵 $Q_3=\begin{bmatrix}E_{n-1}&0\\0&\frac{-1}{\sqrt{|b|}}\end{bmatrix}$ 则 $Q_3^TQ_2^TQ_1^TAQ_1Q_2Q_3=-E_{n}$ 意味着若 $n$ 阶方阵 $A$ 的任意顺序主子式满足奇数阶为负偶数阶为正，则其可合同于负单位阵，故其负定。（证毕）

Remark:
若实对称矩阵A正定，则其任意阶主子阵均正定，特别的，对角元素为正；
若实对称矩阵A负定，则其任意阶主子阵均负定，特别的，对角元素为负；
$\quad$
证明过程与上述定理8.5的必要性证明过程相同，不多加赘述。

(3) 证明：
必要性：
与证明正定时过程类似，此时区别仅在于，取 $\vec{X}_{a,b,c,...}=[0,\dots,x_a,\dots,x_b,\dots,x_c,\dots,0,\dots,0]_{1\times n}^T(下标代表的位置以外的其它元素必为零，而下标位置不全为零，下标任意)，其中1\le a,b,c,...\le n，x_a,x_b,x_c,\dots\in R$
充分性：
若实对称矩阵 $A$ 的任意k阶主子式均非负，则对于矩阵 $\begin{bmatrix} a_{11}+t&a_{12}&\dots&a_{1n}\\ a_{21}&a_{22}+t&\dots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\dots&a_{nn}+t \end{bmatrix}$ 其任意 $k(1\le k\le n)$ 阶顺序主子式，（参见） $\begin{vmatrix} a_{11}+t&a_{12}&\dots&a_{1k}\\ a_{21}&a_{22}+t&\dots&a_{2k}\\ \vdots&\vdots&&\vdots\\ a_{k1}&a_{k2}&\dots&a_{kk}+t \end{vmatrix}=\sum_{i=0}^kt^i\alpha_i\quad(\alpha_i为该顺序主子阵的(k-i)阶主子式之和)$ 当 $t > 0$ 时为正，换而言之矩阵 $A + tE (t > 0)$ 为正定矩阵。
假设 $A$ 的特征值为 $\lambda_i(i=1,\dots,n)$ ,则 $A + tE$ 的特征值为 $\lambda_i+t(i=1,\dots,n)$
由于 $t$ 为正时， $A + tE$ 正定，故 $\lambda_i+t>0(i=1,\dots,n)对任意t>0恒成立$ 则 $\lambda_i\ge 0$ ，则 $A$ 为半正定矩阵。

(4) 证明：
若 $f(\vec{X})=\vec{X}^TA\vec{X}$ 半负定，则 $-f(\vec{X})=\vec{X}^T(-A)\vec{X}$ 半正定 $\Longleftrightarrow (-A)的k阶主子式非负$
又 $(- A)$ 的 $k$ 阶主子式 $D_k$ 与 $A$ 的 $k$ 阶主子式 $D'_k$ 满足: $D_k=(-1)^kD'_k$ 则： $(-A)的k阶主子式D_k非负\Longleftrightarrow (-1)^kD'_k非负，即A的奇数阶主子式非正，偶数阶主子式非负（证毕）$