一、由内积到正交
为了说明正交,需要先解释一种运算——内积. 内积的概念源自内积空间,下文摘自我的另一篇博客 内积空间(传送门)
设
V
\small V
V 是实线性空间,在其上定义了内积运算
(
⋅
,
⋅
)
:
V
×
V
→
R
\small (\,\cdot\,,\cdot\,): V \times V \to R
(⋅,⋅):V×V→R,即
∀
x
,
y
∈
V
\small \forall \;x,y \in V
∀x,y∈V,在
R
\small R
R 中都有唯一的一个元素
δ
\delta
δ 与之对应,称为
x
x
x 与
y
y
y 的内积,记为
(
x
,
y
)
(x,y)
(x,y),且满足以下性质:
1.
(
x
,
x
)
≥
0
1.\,(x,x)\geq0
1.(x,x)≥0 且
(
x
,
x
)
=
0
⇔
x
=
0
\,\, (x,x)=0 \Leftrightarrow x=0
(x,x)=0⇔x=0
2.
(
x
,
y
)
=
(
y
,
x
)
2.\,(x,y)=(y,x)
2.(x,y)=(y,x)
3.
(
a
x
,
z
)
=
a
(
x
,
z
)
,
a
∈
R
3.\,(ax,z)=a(x,z),\,a \in R
3.(ax,z)=a(x,z),a∈R
4.
(
x
+
y
,
z
)
=
(
x
,
z
)
+
(
y
,
z
)
4.\,(x+y,z)=(x,z)+(y,z)
4.(x+y,z)=(x,z)+(y,z)
则称 ( V , ( ⋅ , ⋅ ) ) \small (V,(\,\cdot\,,\cdot\,)) (V,(⋅,⋅)) 为内积空间.
可以通过内积来定义向量的长度: ∥ x ∥ = ( x , x ) \small \Vert x\Vert=\sqrt{(x,x)} ∥x∥=(x,x), ∥ k x ∥ = ( k x , k x ) = k 2 ( x , x ) = k ∥ x ∥ \small \Vert kx\Vert=\sqrt{(kx,kx)}=\sqrt{k^2(x,x)}=k \Vert x\Vert ∥kx∥=(kx,kx)=k2(x,x)=k∥x∥.
长度为 1 的向量称为单位向量. 若 α ≠ 0 \small \alpha\neq0 α=0,则由上述性质,向量 α ∥ α ∥ \displaystyle\frac{\alpha}{\Vert \alpha \Vert} ∥α∥α 就是一个单位向量,这一操作通常称为将 α \alpha α 单位化.
在解析几何中,向量
α
,
β
\small \alpha, \beta
α,β 的夹角
⟨
α
,
β
⟩
\small \langle \alpha,\beta \rangle
⟨α,β⟩ 的余弦可以通过内积来表示:
c
o
s
⟨
α
,
β
⟩
=
(
α
,
β
)
∥
α
∥
∥
β
∥
cos\,\langle \alpha,\beta \rangle=\frac{(\alpha,\beta)}{\Vert \alpha\Vert\Vert \beta\Vert}
cos⟨α,β⟩=∥α∥∥β∥(α,β)为了在一般的内积空间中利用上述公式引入夹角的概念,需要先证明一个重要的不等式:
柯西-施瓦兹(Cauchy-Schwarz)不等式 (证明传送门)
(
α
,
β
)
2
≤
(
α
,
α
)
(
β
,
β
)
(\alpha,\beta) ^2\leq(\alpha,\alpha)(\beta,\beta)
(α,β)2≤(α,α)(β,β)则
(
α
,
β
)
≤
∥
α
∥
∥
β
∥
\small (\alpha,\beta)\leq\Vert \alpha\Vert\Vert \beta\Vert
(α,β)≤∥α∥∥β∥. 若
α
,
β
\small \alpha,\beta
α,β 均不为零向量,则有
∣
(
α
,
β
)
∣
∥
α
∥
∥
β
∥
≤
1
\displaystyle\frac{\vert(\alpha,\beta)\vert}{\Vert \alpha\Vert\Vert \beta\Vert}\leq1
∥α∥∥β∥∣(α,β)∣≤1,由此可定义两者间的夹角
⟨
α
,
β
⟩
=
a
r
c
c
o
s
(
α
,
β
)
∥
α
∥
∥
β
∥
,
0
≤
⟨
α
,
β
⟩
≤
π
.
\langle \alpha,\beta \rangle=arccos\frac{(\alpha,\beta)}{\Vert \alpha\Vert\Vert \beta\Vert},0\leq \langle \alpha,\beta \rangle\leq\pi.
⟨α,β⟩=arccos∥α∥∥β∥(α,β),0≤⟨α,β⟩≤π.则内积也可以表示为:
(
α
,
β
)
=
∥
α
∥
∥
β
∥
c
o
s
⟨
α
,
β
⟩
(\alpha, \beta) = \Vert \alpha\Vert\Vert \beta\Vert cos\langle \alpha,\beta \rangle
(α,β)=∥α∥∥β∥cos⟨α,β⟩.
若两向量 α , β \small \alpha, \beta α,β 的内积 ( α , β ) \small (\alpha, \beta) (α,β) 为零,则称两向量相互正交.
显然这里正交的定义与解析几何中向量垂直的说法是一致的,即两个非零向量相互正交的充要条件是它们的夹角为 π / 2 \small \pi/2 π/2.
二、标准正交基
基的概念源于线性空间. 若在线性空间 V \small V V 中有 n n n 个线性无关的向量 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2,\cdots,\alpha_n α1,α2,⋯,αn,且 V \small V V 中任一向量都能由它们线性表出,则 V \small V V 的维数为 n n n,并称 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2,\cdots,\alpha_n α1,α2,⋯,αn 是 V \small V V 的一组基.
在内积空间
V
\small V
V 中的一组非零向量,若它们两两相互正交,则称为一正交向量组.
正交向量组
α
1
,
α
2
,
⋯
,
α
m
\alpha_1, \alpha_2,\cdots,\alpha_m
α1,α2,⋯,αm 一定线性无关,简单证明一下:
设
k
1
α
1
+
k
2
α
2
+
⋯
+
k
m
α
m
=
0
k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m=0
k1α1+k2α2+⋯+kmαm=0
两边同时对
α
i
\alpha_i
αi 作内积,则由正交性,
左边
=
k
i
(
α
i
,
α
i
)
=k_i(\alpha_i,\alpha_i)
=ki(αi,αi),右边
=
0
=0
=0.
又因为
(
α
i
,
α
i
)
≠
0
(\alpha_i,\alpha_i)\neq 0
(αi,αi)=0,所以
k
i
=
0
,
i
=
1
,
2
,
⋯
,
m
k_i=0,i=1,2,\cdots,m
ki=0,i=1,2,⋯,m,故向量组线性无关.
于是
n
n
n 维内积空间
V
\small V
V 中,含有
n
n
n 个向量的正交向量组线性无关,故形成一组基,称为正交基. 进一步,若每个向量的长度均为1,称为标准正交基.
设
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
n
\epsilon_1,\epsilon_2,\cdots,\epsilon_n
ϵ1,ϵ2,⋯,ϵn 为一组标准正交基,由定义,有
(
ϵ
i
,
ϵ
j
)
=
δ
i
j
=
{
1
,
i
=
j
0
,
i
≠
j
(\epsilon_i,\epsilon_j)=\delta_{ij}=\begin{cases} 1, \,\, i=j \\ 0, \,\, i\neq j \end{cases}
(ϵi,ϵj)=δij={1,i=j0,i=j
三、标准正交基,你有什么好?
标准正交基下:
-
向量的坐标可以通过内积简单求出
设 ϵ 1 , ϵ 2 , ⋯ , ϵ n \epsilon_1,\epsilon_2,\cdots,\epsilon_n ϵ1,ϵ2,⋯,ϵn 为 V \small V V 中的一组标准正交基, α \alpha α 为 V \small V V 中任一向量,则 α \alpha α 可以表示成 ϵ 1 , ϵ 2 , ⋯ , ϵ n \epsilon_1,\epsilon_2,\cdots,\epsilon_n ϵ1,ϵ2,⋯,ϵn 的线性组合,即 α = k 1 ϵ 1 + k 2 ϵ 2 + ⋯ + k n ϵ n \alpha=k_1\epsilon_1+k_2\epsilon_2+\cdots+k_n\epsilon_n α=k1ϵ1+k2ϵ2+⋯+knϵn所谓坐标,就是向量在基下的组合系数,即 ( k 1 , k 2 , ⋯ , k n ) (k_1,k_2,\cdots,k_n) (k1,k2,⋯,kn)
用 ϵ \epsilon ϵ 与等式两边作内积,由标准正交基的定义,有 ( α , ϵ i ) = k i , i = 1 , 2 , ⋯ , n (\alpha,\epsilon_i)=k_i,\,i=1,2,\cdots,n (α,ϵi)=ki,i=1,2,⋯,n,于是 α = ( α , ϵ 1 ) ϵ 1 + ( α , ϵ 2 ) ϵ 2 + ⋯ + ( α , ϵ n ) ϵ n . \alpha=(\alpha,\epsilon_1)\epsilon_1+(\alpha,\epsilon_2)\epsilon_2+\cdots+(\alpha,\epsilon_n)\epsilon_n. α=(α,ϵ1)ϵ1+(α,ϵ2)ϵ2+⋯+(α,ϵn)ϵn. -
向量之间的内积可以通过坐标简单表示
设 α = x 1 ϵ 1 + x 2 ϵ 2 + ⋯ + x n ϵ n β = y 1 ϵ 1 + y 2 ϵ 2 + ⋯ + y n ϵ n \begin{aligned}&\alpha=x_1\epsilon_1+x_2\epsilon_2+\cdots+x_n\epsilon_n\\&\beta=y_1\epsilon_1+y_2\epsilon_2+\cdots+y_n\epsilon_n\end{aligned} α=x1ϵ1+x2ϵ2+⋯+xnϵnβ=y1ϵ1+y2ϵ2+⋯+ynϵn则 ( α , β ) = x 1 y 1 + x 2 y 2 + ⋯ + x n y n (\alpha,\beta)=x_1y_1+x_2y_2+\cdots+x_ny_n (α,β)=x1y1+x2y2+⋯+xnyn记 X = ( x 1 , x 2 , ⋯ , x n ) T , Y = ( y 1 , y 2 , ⋯ , y n ) T \small X=(x_1,x_2,\cdots,x_n)^T,\;Y=(y_1,y_2,\cdots,y_n)^T X=(x1,x2,⋯,xn)T,Y=(y1,y2,⋯,yn)T,
则 ( α , β ) = X T Y = Y T X . \small (\alpha,\beta)=X^TY=Y^TX. (α,β)=XTY=YTX.
这个表达式正是几何中向量的内积在直角坐标系下坐标表达式的推广.
四、由基到标准正交基
既然标准正交基这么好,那怎样才能得到一组标准正交基. 下面这个定理给出了答案:
对于
n
n
n 维内积空间任意一组基
α
1
,
α
2
,
⋯
,
α
n
\alpha_1, \alpha_2,\cdots,\alpha_n
α1,α2,⋯,αn,都可以找到一组标准正交基
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
n
\epsilon_1,\epsilon_2,\cdots,\epsilon_n
ϵ1,ϵ2,⋯,ϵn,使得
s
p
a
n
{
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
i
}
=
s
p
a
n
{
α
1
,
α
2
,
⋯
,
α
i
}
,
i
=
1
,
2
,
⋯
,
n
span\lbrace\epsilon_1,\epsilon_2,\cdots,\epsilon_i\rbrace=span\lbrace\alpha_1, \alpha_2,\cdots,\alpha_i\rbrace,i=1,2,\cdots,n
span{ϵ1,ϵ2,⋯,ϵi}=span{α1,α2,⋯,αi},i=1,2,⋯,n即
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
i
\epsilon_1,\epsilon_2,\cdots,\epsilon_i
ϵ1,ϵ2,⋯,ϵi 与
α
1
,
α
2
,
⋯
,
α
i
\alpha_1, \alpha_2,\cdots,\alpha_i
α1,α2,⋯,αi 可以互相线性表出.
证明:
采用构造的方式,给出标准正交基的求法,利用数学归纳法:
(1) 首先,取 ϵ 1 = α 1 ∥ α 1 ∥ \epsilon_1=\frac{\alpha_1}{\Vert \alpha_1\Vert} ϵ1=∥α1∥α1则 ϵ 1 \epsilon_1 ϵ1 与 α 1 \alpha_1 α1 可以相互线性表出,且为单位向量.
(2) 其次,假设已经求出 ϵ 1 , ϵ 2 , ⋯ , ϵ m \epsilon_1,\epsilon_2,\cdots,\epsilon_m ϵ1,ϵ2,⋯,ϵm,它们是单位正交的,具有性质 s p a n { ϵ 1 , ϵ 2 , ⋯ , ϵ m } = s p a n { α 1 , α 2 , ⋯ , α m } span\lbrace\epsilon_1,\epsilon_2,\cdots,\epsilon_m\rbrace=span\lbrace\alpha_1, \alpha_2,\cdots,\alpha_m\rbrace span{ϵ1,ϵ2,⋯,ϵm}=span{α1,α2,⋯,αm}下一步,求 ϵ m + 1 \epsilon_{m+1} ϵm+1.

ϵ m + 1 \epsilon_{m+1} ϵm+1 应当与 ϵ 1 , ϵ 2 , ⋯ , ϵ m \epsilon_1,\epsilon_2,\cdots,\epsilon_m ϵ1,ϵ2,⋯,ϵm 正交,且为单位向量,且需满足 s p a n { ϵ 1 , ϵ 2 , ⋯ , ϵ m + 1 } = s p a n { α 1 , α 2 , ⋯ , α m + 1 } span\lbrace\epsilon_1,\epsilon_2,\cdots,\epsilon_{m+1}\rbrace=span\lbrace\alpha_1, \alpha_2,\cdots,\alpha_{m+1}\rbrace span{ϵ1,ϵ2,⋯,ϵm+1}=span{α1,α2,⋯,αm+1}则 α m + 1 \alpha_{m+1} αm+1 可以由 ϵ 1 , ϵ 2 , ⋯ , ϵ m + 1 \epsilon_1,\epsilon_2,\cdots,\epsilon_{m+1} ϵ1,ϵ2,⋯,ϵm+1 线性表出.
这样选取
ϵ
m
+
1
\epsilon_{m+1}
ϵm+1:
作
α
m
+
1
\alpha_{m+1}
αm+1 在空间
s
p
a
n
{
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
m
}
span\lbrace\epsilon_1,\epsilon_2,\cdots,\epsilon_m\rbrace
span{ϵ1,ϵ2,⋯,ϵm} 上的投影,记作
β
=
k
1
ϵ
1
+
k
2
ϵ
2
+
⋯
+
k
m
ϵ
m
\beta=k_1\epsilon_1+k_2\epsilon_2+\cdots+k_m\epsilon_m
β=k1ϵ1+k2ϵ2+⋯+kmϵm则
α
m
+
1
−
β
\alpha_{m+1}-\beta
αm+1−β 与
s
p
a
n
{
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
m
}
span\lbrace\epsilon_1,\epsilon_2,\cdots,\epsilon_m\rbrace
span{ϵ1,ϵ2,⋯,ϵm} 正交,
则
α
m
+
1
−
β
\alpha_{m+1}-\beta
αm+1−β 与
ϵ
i
,
i
=
1
,
2
,
⋯
,
m
\epsilon_i,i=1,2,\cdots,m
ϵi,i=1,2,⋯,m 正交,即
(
α
m
+
1
−
β
,
ϵ
i
)
=
0
(\alpha_{m+1}-\beta,\epsilon_i)=0
(αm+1−β,ϵi)=0,
将
β
=
k
1
ϵ
1
+
k
2
ϵ
2
+
⋯
+
k
m
ϵ
m
\beta=k_1\epsilon_1+k_2\epsilon_2+\cdots+k_m\epsilon_m
β=k1ϵ1+k2ϵ2+⋯+kmϵm 代入,整理得
(
α
m
+
1
−
k
i
ϵ
i
,
ϵ
i
)
=
0
(\alpha_{m+1}-k_i\epsilon_i,\epsilon_i)=0
(αm+1−kiϵi,ϵi)=0于是
k
i
=
(
α
m
+
1
,
ϵ
i
)
,
i
=
1
,
2
,
⋯
,
m
k_i=(\alpha_{m+1},\epsilon_i),i=1,2,\cdots,m
ki=(αm+1,ϵi),i=1,2,⋯,m,取
ϵ
m
+
1
=
α
m
+
1
−
β
∥
α
m
+
1
−
β
∥
\epsilon_{m+1}=\frac{\alpha_{m+1}-\beta}{\Vert \alpha_{m+1}-\beta\Vert}
ϵm+1=∥αm+1−β∥αm+1−β则
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
m
+
1
\epsilon_1,\epsilon_2,\cdots,\epsilon_{m+1}
ϵ1,ϵ2,⋯,ϵm+1 是一正交向量组,且满足
s
p
a
n
{
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
m
+
1
}
=
s
p
a
n
{
α
1
,
α
2
,
⋯
,
α
m
+
1
}
span\lbrace\epsilon_1,\epsilon_2,\cdots,\epsilon_{m+1}\rbrace=span\lbrace\alpha_1, \alpha_2,\cdots,\alpha_{m+1}\rbrace
span{ϵ1,ϵ2,⋯,ϵm+1}=span{α1,α2,⋯,αm+1} (3) 由归纳法原理,定理得证.
注:由
s
p
a
n
{
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
i
}
=
s
p
a
n
{
α
1
,
α
2
,
⋯
,
α
i
}
,
i
=
1
,
2
,
⋯
,
n
span\lbrace\epsilon_1,\epsilon_2,\cdots,\epsilon_i\rbrace=span\lbrace\alpha_1, \alpha_2,\cdots,\alpha_i\rbrace,i=1,2,\cdots,n
span{ϵ1,ϵ2,⋯,ϵi}=span{α1,α2,⋯,αi},i=1,2,⋯,n 可知,两组基之间的过渡矩阵是上三角形的.
参考文献:北京大学数学系前代数小组. 高等代数[M]. 第四版. 北京:高等教育出版社,2013.
Plus: 如有错误、可以改进的地方、或任何想说的,请在评论区留言!