线性方程组求解-CSDN博客

我们以线性代数的中心问题开启我们的航程：解决线性方程。最重要并且也是最简单的情况就是位置函数的数目等于方程的数目。现在我们有包含 $n$ 个未知变量的 $n$ 个方程，首先从 $n=2$ 开始：

1 x + 2 y = 3 4 x + 5 y = 6 (1)

$\begin{equation} 1x+2y=3\\ 4x+5y=6\tag1 \end{equation}$ 未知变量是

x,y $x,y$ 。我打算用消元和行列式两种方式来求解方程。当然

x,y $x,y$ 由

1,2,3,4,5,6 $1,2,3,4,5,6$ 这些数确定，问题就是如何利用这六个数求解出方程。

消元第二个方程减去第一个方程的四倍。从而消去第二个方程中的 $x$ ，只留下了关于 $y$ 的方程：

$(方程 2) - 4 (方程 1) - 3 y = - 6 (2)$ $\begin{equation} (\text{方程2})-4(\text{方程1})\qquad -3y=-6\tag2 \end{equation}$ 这样就得到 $y=2$ 。然后 $x$ 从第一个方程 $1x+2y=3$ 计算出来：
$1 x + 2 (2) = 3 x = - 1 (3)$ $\begin{equation} 1x+2(2)=3\qquad x=-1\tag3 \end{equation}$ 计算出来后， $x,y$ 也应该满足第二个方程。代入得： $4\times (-1)+5\times 2=6$
行列式 $y=2$ 完全依赖于方程中的六个数。对于 $y$ 存在一个公式(当然 $x$ 也有)，是两个行列式的比值：

$y = ∣ ∣ ∣ 1 4 3 6 ∣ ∣ ∣ ∣ ∣ ∣ 1 4 2 5 ∣ ∣ ∣ = 1 \cdot 6 - 3 \cdot 4 1 \cdot 5 - 2 \cdot 4 = - 6 - 3 = 2 (4)$ $\begin{equation} y=\frac{\begin{vmatrix}1&3\\4&6\end{vmatrix}}{\begin{vmatrix}1&2\\4&5\end{vmatrix}}=\frac{1\cdot 6-3\cdot 4}{1\cdot 5-2\cdot 4}=\frac{-6}{-3}=2\tag4 \end{equation}$ 如果你知道 $2\times 2$ 方阵的行列式，那么它就没有那么神秘了。它同样给出了解 $y=2$ 。同样利用行列式，我们可以求出 $x$ ：
$x = ∣ ∣ ∣ 3 6 2 5 ∣ ∣ ∣ ∣ ∣ ∣ 1 4 2 5 ∣ ∣ ∣ = 3 \cdot 5 - 2 \cdot 6 1 \cdot 5 - 2 \cdot 4 = 3 - 3 = - 1 (5)$ $\begin{equation} x=\frac{\begin{vmatrix}3&2\\6&5\end{vmatrix}}{\begin{vmatrix}1&2\\4&5\end{vmatrix}}=\frac{3\cdot 5-2\cdot 6}{1\cdot 5-2\cdot 4}=\frac{3}{-3}=-1\tag5 \end{equation}$

我们来比较这两种方法，考虑 $n$ 非常大(在科学计算中 $n=1000$ 是非常适中的大小)。事实就是直接对1000个方程使用行列式将是一个大灾难。左边将会有百万级别的数目，既然是正确的，但是效率很低。之后会提到该公式如何得到(克莱姆法则)，但是目前我们需要一个很好的办法来解决这1000个方程。

最好的办法是高斯消元法。这个算法一直被用于解决大型的方程组。以后的大部分例子都是 $n=3$ ，这是看不出太大区别。方程 $(2)(4)$ 基本使用相同的步骤得到 $y=2$ 。之后通过回带到方程(3)中很快得出 $x$ 。对于更大的 $n$ 值，依然有效。消去法比计算行列式要好。

消去法的想法看起来很简单，通过几个例子就能掌握它。它是非常基础的内容，通过简化矩阵我们就能理解它。在此我想讲四点更深层次的内容：

线性代数带来了平面几何。在十维空间中可视化九维平面不太容易。而理解相交于十个方程解的那些平面更难。但是不见得是不可能的。在图1 中有两条直线，相交于点 $(x,y)=(-1,2)$ 。线性代数将图像放到十维空间里，在这个空间里，我们的直觉不得不去想象其几何形状。

图1：左边是例子的单个解，中间和右边是奇异情况，分别是无解和多个解
现在考虑矩阵符号，将 $n$ 个未知量表示成向量 $x$ ， $n$ 个方程表示成 $Ax=b$ 。我们用消去矩阵乘以 $A$ 得到上三角矩阵 $U$ 。这些步骤将矩阵 $A$ 分解为 $L\times U$ ，其中 $L$ 是下三角矩阵：

$A = ∣ ∣ ∣ 1425 ∣ ∣ ∣ = ∣ ∣ ∣ 1401 ∣ ∣ ∣ ∣ ∣ ∣ 10 2 - 3 ∣ ∣ ∣ = L \times U (6)$ $\begin{equation} A=\begin{vmatrix}1&2\\4&5\end{vmatrix}=\begin{vmatrix}1&0\\4&1\end{vmatrix}\begin{vmatrix}1&2\\0&-3\end{vmatrix}=L\times U\tag6 \end{equation}$ 首先我们需要介绍矩阵和向量以及乘法规则。每个矩阵都存在转置 $A^{\mathrm{T}}$ 。这个矩阵还存在逆矩阵 $A^{-1}$
大部分情况下，消去法不会存在问题。矩阵可逆的话，方程 $Ax=b$ 还有一个解。但是在特殊的情况下这种方法就被打破了，既可能是方程组的顺序出错(通过交换一笑就能产生)，也可能是方程没有唯一解。如果将例子中的5换成8，就出现了奇异的情况：

$1 x + 2 y = 3 4 x + 8 y = 6 (7)$ $\begin{equation} 1x+2y=3\\ 4x+8y=6\tag7 \end{equation}$ 消去法依然用第二个减去第一个的四倍，那么结果是：
$(方程 2) - 4 (方程 1) 0 = - 6$ $(\text{方程2})-4(\text{方程1})\qquad 0=-6$
对于 $n$ 个方程组，我们希望粗略算出需要多少步消去运算。计算代价经常决定着模型的精度。一百个方程需要一百万步(乘法和减法)的三分之一。计算机可以很快地计算出来。在一百步之后，舍入误差就已经很明显了。(有些问题敏感，而有些不敏感)在不知道全部细节的情况下，我们想明白实际中出现的大型系统以及他们是如何被解决的。