MIT 线性代数（16—18）读书笔记

最新推荐文章于 2023-06-28 11:03:09 发布

Paul-Huang

最新推荐文章于 2023-06-28 11:03:09 发布

阅读量3.3k

点赞数 6

CC 4.0 BY-SA版权

分类专栏： MIT 线性代数读书笔记文章标签：麻省理工线性代数读书

本文链接：https://blog.csdn.net/huang1024rui/article/details/69568991

MIT 线性代数读书笔记专栏收录该内容

13 篇文章

订阅专栏

本文探讨了投影矩阵和最小二乘法的概念，通过具体实例解释了如何利用这些方法解决过定系统的逼近解问题，并进一步介绍了正交矩阵、Gram-Schmidt正交化法以及QR分解的相关知识。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第十六讲投影矩阵(Ax=b)和最小二乘法

上一讲中，我们知道了投影矩阵 $P=A(A^TA)^{-1}A^T$ ， $P b$ 将会把向量投影在 $A$ 的列空间中。即只要知道矩阵 $A$ 的列空间，就能得到投影矩阵 $P$ 的导出式。
##1.投影矩阵（Ax=b无解的情形）

1.1两个极端的例子：

如果 $b∈C(A)b\in C(A)$ ，则 $P b = b$ ；
如果 $b⊥C(A)b\bot C(A)$ ，则 $P b = 0$ 。

证明1： $Pb = A(A^TA)^{-1}A^Tb\\ = A(A^TA)^{-1}A^TAx\\ =A((A^TA^{-1})A^TA)x =Ax=b$
证明2： $Pb = A(A^TA)^{-1}A^Tb\\ = A(A^TA^{-1})(A^Tb)\\ =A((A^TA^{-1})0=0$
一般情况下， $b$ 将会有一个垂直于 $A$ 的分量，有一个在 $A$ 列空间中的分量，投影的作用就是去掉垂直分量而保留列空间中的分量。

1.2一般情形

一般情况下， $b$ 将会有一个垂直于 $A$ 的分量，有一个在 $A$ 列空间中的分量，投影的作用就是去掉垂直分量而保留列空间中的分量。如图：

向量 $b投影后，有b=e+p, p=Pb, e=(I-P)b，这里的p是b在C(A)中的分量，而e是b在N(A^T)中的分量。$
可以理解为：向量 $b$ 的投影在 $A$ 的column space，error vector的投影在left null space上，我们知道 $P$ ，可以将 $b$ 投影到 $p$ ，那么一个什么样的投影矩阵把 $b$ 投影到了 $e$ ？因为column space与left null space正交补，所以他们共同组成了整个空间， $I$ 的column space就是整个空间， $I - P$ 就是把 $b$ 投影到 $e$ 的矩阵，它和 $P$ 有意义的性质。

2. 最小二乘法（Ax=b）

回到上一讲最后提到的例题：
我们需要找到距离图中三个点 $(1, 1), (2, 2), (3, 2)$ 偏差最小的直线： $y = C + D t$ 。

根据条件可以得到方程组
${C+D=1C+2D=2C+3D=2\begin{cases} C+D&=1 \\ C+2D&=2 \\ C+3D&=2 \\ \end{cases}$
，写作矩阵形式 $[111213][CD]=[122]\begin{bmatrix}1 &1 \\1 &2 \\1&3\\\end{bmatrix}\begin{bmatrix}C\\D\\\end{bmatrix}=\begin{bmatrix}1\\2\\2\\\end{bmatrix}$ ，也就是我们的 $A x = b$ ，很明显方程组无解。
此时我们要找到最接近的解"最优解"，我们要使得解最优即误差最小，定义误差为 $A x - b = e$ 的模长的平方即 $Ax−b∥_2=∥e∥_2=e_{21}+e_{22}+e_{23}$ 。此处使用平方的原因一是排除开根号带来的非线性运算，一是方便利用偏导数求解最小值。

1.利用偏导求解

这里如果使用偏导数我们也能得到关于最优解的方程，展开结果为:
${∥e∥2=e12+e22+e22=(C+D−1)2+(C+2D−2)2+(C+3D−2)2=3C2+14D2+9−10C−22D+12CD\begin{cases} ∥e∥_2&=e_1^2+e_2^2+e_2^2\\ &=(C+D-1)^2+(C+2D-2)^2+(C+3D-2)^2\\ &=3C^2+14D^2+9−10C−22D+12CD\\ \end{cases}$
然后对 $C$ 求偏导为 $6 C - 10 + 12 D = 0$ ；对 $D$ 求偏导为 $28 D - 22 + 12 C = 0$ 。
解方程得 $C^=23,D^=12\hat C=\frac{2}{3}, \hat D=\frac{1}{2}$ ，则“最佳直线”为 $y=23+12ty=\frac{2}{3}+\frac{1}{2}t$ ，带回原方程组解得 $p1=76,p2=53,p3=136p_1=\frac{7}{6}, p_2=\frac{5}{3}, p_3=\frac{13}{6}$ ，即 $e1=−16,e2=13,e3=−16e_1=-\frac{1}{6}, e_2=\frac{1}{3}, e_3=-\frac{1}{6}$ 。
于是我们得到 $p=[7653136],e=[−1613−16]p=\begin{bmatrix}\frac{7}{6}\\\frac{5}{3}\\\frac{13}{6}\end{bmatrix}, e=\begin{bmatrix}-\frac{1}{6}\\\frac{1}{3}\\-\frac{1}{6}\end{bmatrix}$ ，易看出 $b = p + e$ ，同时我们发现 $p⋅e=0p\cdot e=0$ 即 $p⊥ep\bot e$ 。

可以验证，向量p 与e 正交，并且e 与矩阵A 的列空间正交。
$p^Te=7/6*(-1/6)+5/3*1/3+13/6*(-1/6)=0\\ e^Ta_1=1*(-1/6)+1*1/3+1*(-1/6)=0\\ e^Ta_2=1*(-1/6)+2*1/3+3*(-1/6)=0$

误差向量 $e$ 不仅垂直于投影向量 $p$ ，它同时垂直于列空间，如 $[111],[123]\begin{bmatrix}1\\1\\1\end{bmatrix}, \begin{bmatrix}1\\2\\3\end{bmatrix}$ 。

2.利用矩阵求解

用矩阵的方法求解 $Ax^=PbA\hat x=Pb$ 得到的方程是一样的，现在我们尝试解出 $x^=[C^D^]\hat x=\begin{bmatrix}\hat C\\ \hat D\end{bmatrix}$ 与 $p=[p1p2p3]。p=\begin{bmatrix}p_1\\p_2\\p_3\end{bmatrix}。$
$ATAx^=ATbATA=[36614]ATb=[511][36614][C^D^]=[511] A^TA\hat x=A^Tb\\ A^TA= \begin{bmatrix}3&6\\6&14\end{bmatrix}\qquad A^Tb= \begin{bmatrix}5\\11\end{bmatrix}\\ \begin{bmatrix}3&6\\6&14\end{bmatrix} \begin{bmatrix}\hat C\\\hat D\end{bmatrix}= \begin{bmatrix}5\\11\end{bmatrix}\\$

写成方程形式为 ${3C^+16D^=56C^+14D^=11\begin{cases}3\hat C+16\hat D&=5\\6\hat C+14\hat D&=11\\\end{cases}$ ，也称作 $正规方程组（normalequations）\color{red}{正规方程组（normal equations）}$ 。
求的的结果是一样的。

我们现在做的运算也称作 $线性回归（linearregression）\color{red}{线性回归（linear regression）}$ ，使用误差的平方和作为 $测量总误差的标准\color{red}{测量总误差的标准}$ 。

注：
如果有另一个点，如 $(0, 100)$ ，在本例中该点明显距离别的点很远，最小二乘将很容易被离群的点影响， $通常使用最小二乘时会去掉明显离群的点\color{red}{通常使用最小二乘时会去掉明显离群的点}$ 。

3.证明 $A^TA$ 可逆

###3.1 证明可逆
接下来我们观察 $A^TA$ ， $如果A的各列线性无关，求证ATA是可逆矩阵\color{red}{如果A的各列线性无关，求证A^TA是可逆矩阵}$ 。
先假设 $A^TAx=0$ ，两边同时乘以 $x^T$ 有 $x^TA^TAx=0$ ，即 $Ax)^T(Ax)=0$ 。一个矩阵乘其转置结果为零，则这个矩阵也必须为零（ $Ax)^T(Ax)$ 相当于 $A x$ 长度的平方）。则 $A x = 0$ ，结合题设中的“ $A$ 的各列线性无关”，可知 $x = 0$ ，也就是 $A^TA$ 的零空间中有且只有零向量，得证。

###3.2互相垂直线性无关
我们再来看一种线性无关的特殊情况： $互相垂直的单位向量一定是线性无关的\color{red}{互相垂直的单位向量一定是线性无关的}$ 。
比如： $[100][010][001]\begin{bmatrix}1\\0\\0\end{bmatrix}\begin{bmatrix}0\\1\\0\end{bmatrix}\begin{bmatrix}0\\0\\1\end{bmatrix}$ ，这三个正交单位向量也称作标准正交向量组（orthonormal vectors）。
另一个例子 $[cos⁡θsin⁡θ][−sin⁡θcos⁡θ]\begin{bmatrix}\cos\theta\\\sin\theta\end{bmatrix}\begin{bmatrix}-\sin\theta\\\cos\theta\end{bmatrix}$
下一讲研究标准正交向量组。

4.总结

1.记住图的意义：
这里写图片描述
2.最小二乘法求解的意义。
3. $A^TA$ 可逆的条件和正交向量组。

#第十七讲：正交矩阵和Gram-Schmidt正交化法

这是关于正交性最后一讲，已经知道正交空间，比如行空间和零空间，今天主要看正交基和正交矩阵

1.标准正交基与正交矩阵

###1.1 标准正交基

定义** $标准正交向量\color{red}{标准正交向量}$ （orthonormal）： $qiTqj={0i≠j1i=jq_i^Tq_j=\begin{cases}0\quad i\neq j\\1\quad i=j\end{cases}$ ;
2.将标准正交向量放入矩阵中，有 $Q=[q1q2⋯qn]Q=\Bigg[q_1 q_2 \cdots q_n\Bigg]$ ,计算 $Q^TQ$
$QTQ=[10⋯001⋯0⋮⋮⋱⋮00⋯1]=IQ^TQ=\begin{bmatrix}1& 0& \cdots& 0\\0& 1& \cdots& 0\\\vdots& \vdots& \ddots& \vdots\\0& 0& \cdots& 1\end{bmatrix}=I$
我们也把 $Q$ 成为 $标准正交矩阵\color{red}{标准正交矩阵}$ **（orthonormal matrix）。

标准正交基：

举个置换矩阵的例子： $Q=[010100001]Q=\begin{bmatrix}0& 1& 0\\1& 0& 0\\0& 0& 1\end{bmatrix}$ ，则 $QT=[010001100]Q^T=\begin{bmatrix}0& 1& 0\\0& 0& 1\\1& 0& 0\end{bmatrix}$ ，易得 $Q^TQ=I$ 。
使用上一讲的例子 $Q=[cos⁡θ−sin⁡θsin⁡θcos⁡θ]Q=\begin{bmatrix}\cos\theta& -\sin\theta\\\sin\theta& \cos\theta\end{bmatrix}$ ，列向量长度为 $1$ ，且列向量相互正交。
其他例子 $Q=12[111−1]Q=\frac{1}{\sqrt 2}\begin{bmatrix}1& 1\\1& -1\end{bmatrix}$ ，列向量长度为 $1$ ，且列向量相互正交。
使用上一个例子的矩阵，令 $Q′=c[QQQ−Q]Q'=c\begin{bmatrix}Q& Q\\Q& -Q\end{bmatrix}$ ，取合适的 $c$ 另列向量长度为 $1$ 也可以构造标准正交矩阵： $Q=12[11111−11−111−1−11−1−11]Q=\frac{1}{2}\begin{bmatrix}1& 1& 1& 1\\1& -1& 1& -1\\1& 1& -1& -1\\1& -1& -1& 1\end{bmatrix}$ ，这种构造方法以阿德玛（Adhemar）命名，对 $\cdots$ 阶矩阵有效。
再来看一个例子， $Q=13[1−222−1−2221]Q=\frac{1}{3}\begin{bmatrix}1& -2& 2\\2& -1& -2\\2& 2& 1\end{bmatrix}$ ，列向量长度为 $1$ ，且列向量相互正交。格拉姆-施密特正交化法的缺点在于，由于要求得单位向量，所以我们总是除以向量的长度，这导致标准正交矩阵中总是带有根号，而上面几个例子很少有根号。

**标准正交矩阵 **

$Q^TQ$ 对任意的 $Q$ 都成立，但我们更关注 $Q$ 为方阵时的情况，因为其有逆且由 $Q^TQ=I⇒Q^{−1}=Q^T$ ，我们叫这种column vector为标准正交向量组成且为方阵的矩阵为正交矩阵 orthogonal matrix。

注意：标准正交矩阵 orthogonormal matrix不一定是方阵，当它是方阵的时候，我们叫它正交矩阵 orthogonal matrix。

1.2正交矩阵

为什么我们如此关注标准正交矩阵 orthogonormal matrix为方阵的情形？

上一讲我们研究了 $A^TA$ 的特性，联系我们之前学习的投影矩阵projection matrix，将向量 $b$ 投影在标准正交矩阵 $Q$ 的列空间中，根据上一讲的公式得 $P=Q(Q^TQ)^{-1}Q^T$ ，由于标准正交矩阵 $Q$ 的性质，易得 $P=QQ^T$ 。

我们断言，当列向量为标准正交基时， $QQ^T$ 是投影矩阵。极端情况，假设矩阵是方阵，而其列向量是标准正交的，则其列空间就是整个向量空间，而投影整个空间的投影矩阵就是单位矩阵，此时 $QQ^T=I$ 。

投影矩阵的两个性质：

$QQ^T)^T=QQ^T$ ，
证明： $QQ^T)^T=(Q^T)^TQ^T=QQ^T$

2. $QQ^T)^2=QQ^T$
证明： $QQ^T)^2=QQ^TQQ^T=Q(Q^TQ)Q^T=QQ^T$

$我们计算的ATAx^=ATb\color{red}{我们计算的A^TA\hat x=A^Tb}$ ，现在变为 $QTQx^=QTbQ^TQ\hat x=Q^Tb$ ，也就是 $x^=QTb\hat x=Q^Tb$ ，分解开来看就是 $x^i=qiTb‾\underline{\hat x_i=q_i^Tb}$ ，这个式子在很多数学领域都有重要作用。当我们知道标准正交基，则解向量第 $i$ 个分量为基的第 $i$ 个分量乘以b，在第 $i$ 个基方向上的投影就等于q_i^Tb。}$

##2. Gram-Schmidt正交化法

这是一种将矩阵转化为标准正交向量orthogonormal matrix的方法。按老师的说法Schmidt教我们如何将一个向量标准化normalized，而Graham教我们如何使得各个向量正交orthogonal。

总思路：
已知相互无关的向量 $a$ , $b$ ，目标要将 $a$ , $b$ 变成相互正交且长度为$1 $的$ q_1 $,$ q_2 $，可将向量$ a$ 固定，然后 $b$ 投影到$a $上，误差$ e=B$.

我们有两个线性无关的向量 $a, b$ ，先把它们化为单位正交向量 $A, B$ ：

我们取定 $a$ 向量的方向， $a = A$ ；
接下来将 $b$ 投影在 $A$ 的法方向上得到 $B$ ，也就是求子空间投影一讲中，我们提到的误差向量 $e = b - p$ ，即 $B=b−ATbATAAB=b-\frac{A^Tb}{A^TA}A$ 。检验一下 $A⊥BA\bot B$ ， $ATB=ATb−ATATbATAA=ATb−ATAATAATb=0A^TB=A^Tb-A^T\frac{A^Tb}{A^TA}A=A^Tb-\frac{A^TA}{A^TA}A^Tb=0$ 。（ $ATbATAA\frac{A^Tb}{A^TA}A$ 就是 $Ax^=pA\hat x=p$ ）；
再将它们单位化，变为单位正交向量 $q1=A∥A∥,q2=B∥B∥q_1=\frac{A}{\left\|A\right\|}, q_2=\frac{B}{\left\|B\right\|}$ 。

如果我们有三个线性无关的向量 $a, b, c$ ，则我们现需要求它们变换成单位正交向量 $A, B, C$ ：

前两个向量我们已经得到了，我们现在需要求第三个向量同时正交于 $A, B$ ；
我们依然沿用上面的方法，从 $c$ 中减去其在 $A, B$ 上的分量，得到正交与 $A, B$ 的 $C$ ： $C=c−ATcATAA−BTcBTBBC=c-\frac{A^Tc}{A^TA}A-\frac{B^Tc}{B^TB}B$ ；
再将它们单位化，变为单位正交向量 $q1=A∥A∥,q2=B∥B∥,q3=C∥C∥q_1=\frac{A}{\left\|A\right\|}, q_2=\frac{B}{\left\|B\right\|}, q_3=\frac{C}{\left\|C\right\|}$ 。

这里写图片描述

例子：
现在我们试验一下推导出来的公式， $a=[111],b=[102]a=\begin{bmatrix}1\\1\\1\end{bmatrix}, b=\begin{bmatrix}1\\0\\2\end{bmatrix}$ ：
则 $A=a=[111]A=a=\begin{bmatrix}1\\1\\1\end{bmatrix}$ ；
根据公式有 $B = a - h A$ ， $h$ 是比值 $ATbATA=33\frac{A^Tb}{A^TA}=\frac{3}{3}$ ，则 $B=[111]−33[102]=[0−11]B=\begin{bmatrix}1\\1\\1\end{bmatrix}-\frac{3}{3}\begin{bmatrix}1\\0\\2\end{bmatrix}=\begin{bmatrix}0\\-1\\1\end{bmatrix}$ 。验证一下正交性有 $A⋅B=0A\cdot B=0$ 。
单位化， $q1=13[111],q2=12[102]q_1=\frac{1}{\sqrt 3}\begin{bmatrix}1\\1\\1\end{bmatrix},\quad q_2=\frac{1}{\sqrt 2}\begin{bmatrix}1\\0\\2\end{bmatrix}$ ，则标准正交矩阵为 $Q=[13013−121312]Q=\begin{bmatrix}\frac{1}{\sqrt 3}& 0\\\frac{1}{\sqrt 3}& -\frac{1}{\sqrt 2}\\\frac{1}{\sqrt 3}& \frac{1}{\sqrt 2}\end{bmatrix}$ ，对比原来的矩阵 $D=[111012]D=\begin{bmatrix}1& 1\\1& 0\\1& 2\end{bmatrix}$ ，有 $D, Q$ 的列空间是相同的，我们只是将原来的基标准正交化了。

##3.QR分解

我们曾经用矩阵的眼光审视消元法，有 $A = L U$ 。同样的，我们也用矩阵表达标准正交化， $A = Q R$ ，这里的 $R$ 是一个上三角矩阵upper triangular matrix 。

设矩阵 $A$ 有两个列向量 $a_1 a_2\Bigg]$ ，则标准正交化后有 $[a1a2]=[q1q2][a1Tq1a2Tq1a1Tq2a2Tq2]\Bigg[a_1 a_2\Bigg]=\Bigg[q_1 q_2\Bigg]\begin{bmatrix}a_1^Tq_1& a_2^Tq_1\\a_1^Tq_2& a_2^Tq_2\end{bmatrix}$ ，而左下角的 $a_1^Tq_2$ 始终为 $0$ ，因为Gram-Schmidt正交化总是使得 $a1⊥q2a_1\bot q_2$ ，后来构造的向量总是正交于先前的向量。所以这个 $R$ 矩阵是一个上三角矩阵。

##4.总结

1.标准正交基与正交矩阵；
2.Gram-Schmidt正交标准化；
3.QR分解（与LU分解的区别）。

#第十八讲：行列式及其性质

行列式最早是应用在用来判断方程组是否有解，在矩阵被发明后，行列式就拥有了更多的性质和应用。其强大之处在于将整个矩阵的信息压缩到了一个值当中。
行列式的英文名为determinant：决定因素，因为他可以决定方程组是否有解即矩阵是否可逆，从另外一个角度来理解，行列式代表了这个矩阵的特征，这是学习特征分解的前置概念。
##1.基础性质

本讲我们讨论出行列式（determinant）的性质：

行列式的基本性质：
性质1： $det⁡I=1，单位矩阵行列式值为一。\color{red}{\det{I}=1，单位矩阵行列式值为一。}$
性质2： $交换行，行列式变号。\color{red}{交换行，行列式变号。}$
性质3： a. $∣tatbtctd∣=t∣abcd∣。\color{red}{\begin{vmatrix}ta& tb\\tc& td\end{vmatrix}=t\begin{vmatrix}a& b\\c& d\end{vmatrix}。 }$
b. $∣a+a′b+b′cd∣=∣abcd∣+∣a′b′cd∣。\color{red}{\begin{vmatrix}a+a'& b+b'\\c& d\end{vmatrix}=\begin{vmatrix}a& b\\c& d\end{vmatrix}+\begin{vmatrix}a'& b'\\c& d\end{vmatrix}。}$

由性质1和2可知，对置换矩阵有 $det⁡P={1even−1odd\det P=\begin{cases}1\quad & even\\-1\quad & odd\end{cases}$ 。
举例： $∣1001∣=1,∣0110∣=−1\begin{vmatrix}1& 0\\0& 1\end{vmatrix}=1,\quad\begin{vmatrix}0& 1\\1& 0\end{vmatrix}=-1$ ，于是我们猜想，对于二阶方阵，行列式的计算公式为 $∣abcd∣=ad−bc\begin{vmatrix}a& b\\c& d\end{vmatrix}=ad-bc$ 。

性质3(b)对于每行都单独成立，其他行则不变，即不能同时组合第一行和第二行。$det(A+B)≠det(A)+det(B) $。

2. 推导出的性质

更多的性质可以从以上的三条性质中推导出来。

性质4： $如果两行相等，则行列式为零。使用性质2交换两行易证。\color{red}{如果两行相等，则行列式为零。使用性质2交换两行易证。}$

**性质5 **： $从第k行中减去第i行的l倍，行列式不变。\color{red}{从第k行中减去第i行的l倍，行列式不变。}$
解析：这条性质是针对消元的，我们可以先消元，将方阵变为上三角形式后再计算行列式。
举例： $∣abc−lad−lb∣=3.b∣abcd∣+∣ab−la−lb∣=3.a∣abcd∣−l∣abab∣=4∣abcd∣\begin{vmatrix}a& b\\c-la& d-lb\end{vmatrix}\stackrel{3.b}{=}\begin{vmatrix}a& b\\c& d\end{vmatrix}+\begin{vmatrix}a& b\\-la& -lb\end{vmatrix}\stackrel{3.a}{=}\begin{vmatrix}a& b\\c& d\end{vmatrix}-l\begin{vmatrix}a& b\\a& b\end{vmatrix}\stackrel{4}{=}\begin{vmatrix}a& b\\c& d\end{vmatrix}$

性质6： $如果方阵的某一行为零，则其行列式值为零。\color{red}{如果方阵的某一行为零，则其行列式值为零。}$
证明：使用性质3（a）对为零行乘以不为零系数 $l$ ，使 $ldet⁡A=det⁡Al\det A=\det A$ 即可证明；或使用性质5将某行加到为零行，使存在两行相等后使用性质4即可证明。
性质7： $有上三角行列式U=∣d1∗⋯∗0d2⋯∗⋮⋮⋱⋮00⋯dn∣，则det⁡U=d1d2⋯dn。\color{red}{有上三角行列式U=\begin{vmatrix}d_{1}& *& \cdots& *\\0& d_{2}& \cdots& *\\\vdots& \vdots& \ddots& \vdots\\0& 0& \cdots& d_{n}\end{vmatrix}，则\det U=d_1d_2\cdots d_n。}$
证明：使用性质5，从最后一行开始，将对角元素上方的 $*$ 元素依次变为零，可以得到型为 $D=∣d10⋯00d2⋯0⋮⋮⋱⋮00⋯dn∣D=\begin{vmatrix}d_{1}& 0& \cdots& 0\\0& d_{2}& \cdots& 0\\\vdots& \vdots& \ddots& \vdots\\0& 0&\cdots&d_{n}\end{vmatrix}$ 的对角行列式，再使用性质3将对角元素提出得到 $dndn−1⋯d1∣10⋯001⋯0⋮⋮⋱⋮00⋯1∣d_nd_{n-1}\cdots d_1\begin{vmatrix}1& 0& \cdots& 0\\0& 1& \cdots& 0\\\vdots& \vdots& \ddots& \vdots\\0& 0& \cdots& 1\end{vmatrix}$ ，得证。
性质8： $当矩阵A为奇异矩阵时，det⁡A=0；当且仅当A可逆时，有det⁡A≠0\color{red}{当矩阵A为奇异矩阵时，\det A=0；当且仅当A可逆时，有\det A\neq0}$ 。
证明：如果矩阵可逆，则化简为上三角形式后各行都含有主元，行列式即为主元乘积；如果矩阵奇异，则化简为上三角形式时会出现全零行，行列式为零。
再回顾二阶情况： $∣abcd∣→消元∣ab0d−cab∣=ad−bc\begin{vmatrix}a& b\\c& d\end{vmatrix}\xrightarrow{消元}\begin{vmatrix}a& b\\0& d-\frac{c}{a}b\end{vmatrix}=ad-bc$ ，前面的猜想得到证实。

性质9： $det⁡AB=(det⁡A)(det⁡B)\color{red}{\det AB=(\det A)(\det B)}$ 。
解析：使用这一性质， $det I=\det{A^{-1}A}=\det A^{-1}\det A$ ，所以 $det⁡A−1=1det⁡A\det A^{-1}=\frac{1}{\det A}$ 。
同时还可以得到： $det A^2=(\det A)^2$ ，以及 $det 2A=2^n\det A$ ，这个式子就像是求体积，对三维物体有每边翻倍则体积变为原来的八倍。

性质10： $det⁡AT=det⁡A。\color{red}{\det A^T=\det A。}$
$前面一直在关注行的属性给行列式带来的变化，有了这条性质，行的属性同样适用于列，比如对性质2就有“交换列行列式变号”。\color{red}{前面一直在关注行的属性给行列式带来的变化，有了这条性质，行的属性同样适用于列，比如对性质2就有“交换列行列式变号”。}$
证明： $∣AT∣=∣A∣→∣UTLT∣=∣LU∣→∣UT∣∣LT∣=∣L∣∣U∣\left|A^T\right|=\left|A\right|\rightarrow\left|U^TL^T\right|=\left|LU\right|\rightarrow\left|U^T\right|\left|L^T\right|=\left|L\right|\left|U\right|$ ，值得注意的是， $L, U$ 的行列式并不因为转置而改变，得证。