线性代数(14)——正交性、标准正交基和投影

最新推荐文章于 2024-11-23 14:49:18 发布

Jakob_Hu

最新推荐文章于 2024-11-23 14:49:18 发布

阅读量2w

点赞数 11

分类专栏：线性代数

本文链接：https://blog.csdn.net/Jakob_Hu/article/details/90813435

版权

线性代数同时被 2 个专栏收录

22 篇文章

订阅专栏

线性代数

20 篇文章

订阅专栏

本文深入探讨了正交性、正交基与标准正交基的概念，解释了它们在高维空间中的应用，包括投影计算、Gram-Schmidt正交化过程及其实现。文章还讨论了标准正交基的性质及其在机器学习中的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

正交基与标准正交基

一个 $n$ 维空间中任何一组线性无关的向量，都是这个 $n$ 维空间的一组基。当这组基的向量两两垂直，则称为正交基。而标准正交基只是将正交基又添加了一个条件，模长为1。一个空间可以有无数组基向量，正交基和标准正交基也同样是有无数组的。

正交基的好处在于可以很方便地表示空间中的点，用数学语言表示为，两个向量 $\vec{u}$ 和 $\vec{v}$ 的乘积，
$\vec{u}\cdot\vec{v}=u_1\cdot v_1+u_2\cdot v_2+...+u_n\cdot v_n=||\vec{u}||\cdot ||\vec{v}||\cdot cos\theta$
当 $\theta=90°$ 时， $cos\theta=0$ ，相应的 $\vec{u}\cdot\vec{v}=0$ ，称这两个向量相互垂直或相互正交。

正交向量组则是一组向量，任意两个向量都满足正交的关系，则称为正交向量组。正交向量组的一个很好的性质是，正交非零向量组一定线性无关。这一性质的证明并不复杂，
在这里插入图片描述
回顾之前的知识， $n$ 维空间中，任意 $n$ 个线性无关的向量一定是n维空间的基。同理， $n$ 个非零正交向量一定是 $n$ 维空间的基。

一维投影

一维投影相当于把一个向量投影到另一个向量，可以进一步求取正交基，如下图中两个不共线的向量 $\vec{u}$ 和 $\vec{v}$ (也可以直接理解为二维空间的一组基)，向量 $\vec{v}$ 对 $\vec{u}$ 做投影得到向量 $\vec{p}$ ，通过向量 $\vec{p}$ 可以计算出与向量 $\vec{u}$ 正交的向量 $\vec{v}-\vec{p}$ 。
在这里插入图片描述
知道了 $\vec{p}$ 的方向和大小就可以得到向量 $\vec{p}$ 的表示，

求出向量 $\vec{p}$ 后，进一步求取向量 $\vec{v}-\vec{p}$ 是十分容易的，这就解决了在二维空间中求取一组正交基的问题。随着空间维度的上升，求取的过程会变得复杂，但是求取正交基依旧是能找到特定方法的过程。

高维投影和Gram-Schmidt过程

通过任意维度的一组基构造空间的正交基的算法。

三维空间

以三维向量为例，假设存在一组三维向量，需要求出这三个向量所在空间的正交基，其中两个已经处理得到相互正交的向量 $\vec{p_1}$ 和 $\vec{p_2}$ 。此时空间的基为 $\vec{w}、\vec{p_1}和\vec{p_2}$ ，
在这里插入图片描述
进一步需要做的就是做 $\vec{w}$ 向量在 $\vec{p_1}和\vec{p_2}$ 构成的空间中的投影 $\vec{p}$ ， $\vec{w}-\vec{p}$ 的向量就是所要求的正交向量，

问题就转化为如何求取 $\vec{w}$ 在 $\vec{p_1}和\vec{p_2}$ 上的投影 $\vec{p}$ ，进行如下转换，
在这里插入图片描述
依据之前二维空间中的投影计算公式，可以得到 $\vec{a}$ 和 $\vec{b}$ 的向量，得到如下公式

三维空间求正交基的整个过程可以看做是先求出相应的二维空间的正交基，进一步求取三维空间正交基。

四维及以上空间

四维以上的空间是无法可视化的，但是与三维空间相似，可以先求取低维度空间的正交基，在其基础上进行高一维度正交基的求取。
在这里插入图片描述
给出任何一组 $n$ 维空间的基，正交基的过程都可以通过逐一维度的计算得到。任何一个维度的向量都减去它在低维度空间中已经正交的向量的投影，这一过程就是Gram-Schmidt过程。

实现Gram-Schmidt过程

# -*- coding: utf-8 -*-
from .Vector import Vector
from .Matrix import Matrix
from .LinearSystem import rank


def gram_schmidt_process(basis):
	"""
	:param basis: 一组基向量
	"""
	# 下面两行可以视为对传入的向量进行Gauss-Jordan消元法，确保没有零行，即线性无关
	matrix = Matrix(basis)
    assert rank(matrix) == len(basis)

	# 所有互相正交的向量存放在 res这个列表中
    res = [basis[0]]
    for i in range(1, len(basis)):
    	# 下面的三行代码是上方加粗语句过程的实现
        p = basis[i]
        for r in res:
            p = p - basis[i].dot(r) / r.dot(r) * r
        res.append(p)

	return res


if __name__ == "__main__":
    basis1 = [Vector([2, 1]), Vector([1, 1])]
    res1 = gram_schmidt_process(basis1)
    for row in res1:
        print(row)    # 返回 (2, 1)  (-0.2, 0.4)

    print(res1[0].dot(res[1]))    # 返回0，即二者正交

    # 求取标准正交基
    res1 = [row / row.norm() for row in res1]

标准正交基的性质

空间的基可以排列成一个矩阵，矩阵的每一列就是这组基中的一个基向量。

$n$ 个 $n$ 维的标准正交基可以按照相同的方式排列成一个矩阵（方阵），称为标准正交矩阵，表示为 $Q$ 。

性质1
$Q^T\cdot Q=I$

除了主对角线的元素，其余都是相互正交的两个向量的点乘，结果为0。主对角线实际上是标准正交向量的模，为1。
性质2
标准正交矩阵是可逆的。
标准正交矩阵的各列都是线性无关的，这与矩阵可逆的等价命题是相同的，回顾矩阵可逆的等价命题，

$Q^T$ 是 $Q$ 的左逆，则 $Q^T$ 也一定是 $Q$ 的右逆。即 $Q^T$ 是Q的逆，所以得到标准正交矩阵的一个重要性质，对于标准正交矩阵而言， $Q^T = Q^{-1}$ 。