欧几里得空间

最新推荐文章于 2024-06-15 11:14:29 发布

kuafu1994

最新推荐文章于 2024-06-15 11:14:29 发布

阅读量6k

点赞数 5

分类专栏：计算机科学文章标签：数学线性代数

计算机科学专栏收录该内容

6 篇文章 0 订阅

订阅专栏

转载自 http://zhangpengfei.tech/2018/11/19/hello-2015/

线性代数(Linear Algebra)

本科的时候也学过线性代数，但是当时只是学了一遍，或者说只是为了考试学了一遍，当时从来没有问过学来干嘛，不过当我开始系统地学习PCA(Principal Component Analysis)
及SVD(Singular Value Decomposition)之后，我才发现，喔，原来线性代数还可以这么用, 有的时候，通过一些简单的转换，就可以以量级地减少某些应用的计算量。这篇博客主要参考了一下这些资料：

在这篇博客中，我们重点要搞清楚两个概念，一个是线性变换，一个是欧式空间。

线性变换

一直以来，对向量 $v$ 做线性变换(linear transformation), 我都简单地认为是在 $v$ 左边乘以一个矩阵， $M v$ 。
事实上线性变化其实是有一个非常严格的定义的，现在有一个变换， $T$ ，当输入一个向量 $v$ ，输出一个值 $T (v)$ ，
这个输出可以是一个向量，也可以是一个标量。只要变换 $T$ 满足以下这些条件：
对于任意向量 $v$ 和 $w$ , 以及任意实数 $c$ ，

$T (v + w) = T (v) + T (w)$

$T (c v) = c T (v)$

并且如果向量 $v = 0$ ，那么 $T (v)$ 必须等于 $0$ （当然这个可以从第一个条件推导出来）。

现在我们需要问一个问题：是不是所有的从向量空间 $V=R^n$ 到向量空间 $W=R^m$ 的线性变换都是通过矩阵得来的，如 $w = A v$ ? 当一个线性变换T被描述为旋转，投影等，其后是否总是存在着一个矩阵。答案是yes，所以我一开始的理解其实是正确的，至少在一般情况是这样。

现在假设某个线性转换 $T$ 将一个 $n$ 维的向量空间 $V$ 转换到一个 $m$ 维的向量空间 $W$ 。其中空间 $V$ 的基向量是 $v_1, v_2, v_3, ..., v_n$ , 空间 $W$ 的基向量是 $w_1, w_2, w_3,..., w_m$ 。我们必然可以用一个矩阵 $A$ 来来表示这个转换，那么如何求解这个矩阵？为了找到矩阵 $M$ 的第一列，我们通过转换 $T$ 将 $v_1$ 转换为 $T(v_1)$ ，因为 $T(v_1)$ 存在于 $m$ 维向量空间 $W$ 中，所以可以用以下形式表示 $T(v_1)$ ：

$T(v_1)=a_{11}w_{1} + ... + a_{m1}w_{m}$

$a_{11}, a_{21}, ...,a_{m1}$ 即矩阵 $A$ 的第一列，同理，我们亦可以求出 $A$ 的其他列。从 $A$ 的求解过程中，我们也可以看出矩阵 $A$ 取决于基向量 ${v_i\}_{i=0}^n$ 和 ${w_{i}\}_{i=0}^{m}$ 。

欧式空间

现在对于欧式空间的定义有很多种，但这些定义之间只有非常细微的差别。在这里我们选取一种最简单并且满足我们要求的定义：

设 $V$ 是实数域 $R$ 上的一个有限维向量空间。如果对于 $V$ 中任意一对向量 $v$ , $w$ , 有一个确定的记做 $< v, w >$ 的实数与它们对应，叫做向量 $v$ 与 $w$ 的内积(标量积)，并且下列条件被满足：

$< v, w > = < w, v >$
$< c x, y > = c < x, y >$
$< v + w, z > = < v, z > + < w, z >$
$\langle v, v\rangle >0$ , if $v\ne 0$ ;

这里 $v, w, z$ 是 $V$ 中的任意向量， $c$ 是任意实数，那么 $V$ 叫作对这个内积的欧式空间。其中有很多种不同的映射 $< x, y >$ 满足上述条件，其中有一种最为有名：

$<x,y>=\sum_{i=1}^{n}x_iy_i$

我们将此称为标准内积。这里，我们将关于标准内积的，以向量 $(1, 0, . . ., 0), (0, 1, . . ., 0), (0, 0, . . ., 0, 1$ $ 为基的欧式空间称为标准欧式空间。

现在，从任意欧式空间 $V$ 中，我们定义 $V$ 上的范数（norm)为一个 $V\to R$ 的映射，

$\|x\|=\sqrt{<x,x>}$ , $x\in V$

这里我们可以简单地将欧几里得空间中的向量 $x$ 的范数看成是该向量到原点的距离。并且，任意范数为1的向量，都被称为单位向量。接下来我们看当欧式空中向量 $x, y$ 之间满足 $< x, y > = 0$ 时，会有什么有趣的事发生。

标准正交基

当向量 $x,y\in V$ , $V$ 是欧式空间，且满足 $< x, y > = 0$ , 那么我们称向量 $x, y$ 正交。当欧式空间中某个向量集 $S$ 中的向量两两正交时，则我们称该向量集为正交向量集，更进一步如果该向量集中的每个向量都是单位向量，那么我们称该向量集为标准正交向量集。在关于标准内积的欧式空间中最简单的正交向量集是标准基， $(1, 0, . . ., 0), (0, 1, . . ., 0), (0, 0, . . . 0, 1)$ 。

从某种意义上说，欧式空间中的内积 $< x, y >$ 基本给出了向量 $x$ 在向量 $y$ 上投影的长度，这里我们给出向量 $x$ 在向量 $y$ 上投影的定义：

向量 $x$ 在向量 $y$ 上的投影， $p_y(x)$ ，是 $V\to V$ 的映射，定义为 $p_y(x)=<x,y>\frac{y}{\|y\|^2}$ 。很容易证明向量 $x-p_y(x)$ 与向量 $p_y(x)$ 正交，即 $\langle x-p_y(x), p_y(x)\rangle=0$ 。同时我们可以很容易地将欧式空间中的一个向量 $v$ 分解为两个正交的向量，即 $v=(v-p_w(v)) + P_w(v)$ 。

我们知道除了两两相互正交之外，标准基中的每个向量的范数都为1。我们称这样类似于标准基的向量基为标准正交基。我们常常将标准正交基表示为 $e_1, e_2, ..., e_n)$ 。给定欧式空间 $V$ 的标准正交基，我们可以将该空间中的任意向量 $v$ 分解为：

$p_{e_1}(v) + p_{e_2}(v) + ... + p_{e_n}(v) = \langle v,e_1\rangle e_1 + ... + \langle v, e_n\rangle e_n$

同时，因为一个向量在线性空间中可以表示为基向量的线性组合，所以我们可以知道这些内积 $\langle v, e_i\rangle$ 就是那些相关的参数。正因为这个事实把我们导向一个非常有用的定理，不过在介绍这个定理之前，我们先需要说清楚一个定义：

在两个欧式空间 $V, W$ ，如果存在线性同构， $f:V\to W$ , 对于任意 $x,y\in V$ 满足 $\langle x,y\rangle_{V}= \langle f(x), f(y)\rangle_{W}$ ，那么我们说 $V, W$ 等距同构。

然而，两个向量空间之间如果存在线性同构，那么这两个向量空间是完全相同的。所以如果两个欧式空间等距同构，那么这两个欧式空间有相同的测度，拓扑及几何结构，可能仅仅是所采用的基不同。

所以我们有以下这个定理，任意一个 $n$ 维欧式空间都与 $n$ 维标准欧式空间等距同构。不过在证明这个定理之前，我们需要先证明，任意一个有限维的欧式空间都有一组标准正交基。

(Gram-Schmidt):有限维欧式空间中任意一组基都可以转换为一组标准正交积。这个定理被称为Gram-Schmidt定理。

证明：给定一个基(x_1,x_2, …, x_n)，我们得到下面这个算法：

1:
$e_1 = \frac{x_1}{\|x_1\|}$

For i = 2, …, n:
$z_i = \sum_{j=1}^{i-1}p_{e_j}(x_i) \\\\ e_i = \frac{x_i - z_i}{\|x_i - z_i\|}$

我们可以从几何的角度来阐述上述算法，每一个 $z_i$ 都是 $x_i$ 在 $e_1, e_2, ..., e_{i-1})$ 为基的子向量空间中的投影。而 $x_i - z_i$ 正交于 $v\in (e_1, e_2, ..., e_{i-1})$ ，而这里我们有可以保证 $x_i-z_i\ne 0$ ，因为基 $x_1, x_2, ..., x_n)$ 的线性不相关性。最后我们将 $x_i-z_i$ 除以 $x_i - z_i\|$ 归一化后得到 $e_i$ 。

接下来我们需要证明这篇文章最重要的一个定理：任意一个n维欧式空间都与n维标准欧式空间等距同构。这里，因为每个n维欧式空间W都有一个标准正交基(e_1, e_2, …, e_n)，已知标准欧式空间为E，令映射f: E\to W为f((x_1, x_2, …, x_n)) = x_1e_1 + x_2e_2 + … + x_ne_n，由此我们可以看到：

$\begin{aligned} \langle f((a_1, a_2, ..., a_n)), f((b_1, b_2, ..., b_n))\rangle \\\\ = \langle a_1e_1+...+a_ne_n, b_1e_1+b_2e_2+...+b_ne_n\rangle \\\\ = \sum_{i=1}^{n}a_i\langle e_i, b_1e_1+b_2e_2+...+b_ne_n \rangle \\\\ = \sum_{j=1}^{n}\sum_{i=1}^{n} a_ib_j\langle e_i, e_j\rangle = a_1b_1 + ... + a_nb_n\\\\ = \langle (a_1, b_1, ..., b_n), (b_1, b_2, ..., b_n) \rangle \end{aligned}$

由此可证， $f:E\to W$ 为线性同构，因此， $W$ 与 $E$ 线性同构。

kuafu1994

关注

5
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
欧几里得空间

转载自 http://zhangpengfei.tech/2018/11/19/hello-2015/线性代数(Linear Algebra)本科的时候也学过线性代数，但是当时只是学了一遍，或者说只是为了考试学了一遍，当时从来没有问过学来干嘛，不过当我开始系统地学习PCA(Principal Component Analysis)及SVD(Singular Value Decomposit...
复制链接

扫一扫