作者水平有限,欢迎大家提出文中错误
线性变换和基变换
基本概念
基
设 V V V是数域 K K K上的线性空间, x 1 , x 2 , ⋯ , x r ∈ V x_1,x_2,\cdots,x_r \in V x1,x2,⋯,xr∈V,若 x 1 , x 2 , ⋯ , x r x_1,x_2,\cdots,x_r x1,x2,⋯,xr可以
- x 1 , x 2 , ⋯ , x r x_1,x_2,\cdots,x_r x1,x2,⋯,xr线性无关
- s p a n { x 1 , x 2 , ⋯ , x r } = V span\{x_1,x_2,\cdots,x_r\}=V span{x1,x2,⋯,xr}=V
称 x 1 , x 2 , ⋯ , x r x_1,x_2,\cdots,x_r x1,x2,⋯,xr是 V V V的一组基
线性变换
如果数域
K
K
K上有线性空间
V
V
V的一个变换
T
T
T具有下列性质:
T
(
k
x
+
l
y
)
=
k
T
(
x
)
+
l
T
(
y
)
,
x
,
y
∈
V
;
k
,
l
∈
K
T(kx+ly)=kT(x)+lT(y),x,y\in V;k,l\in K
T(kx+ly)=kT(x)+lT(y),x,y∈V;k,l∈K
则称
T
T
T是
V
V
V的一个线性变换或线性算子
- 投影变换是线性变换
- 平移变换不是线性变换
- T ( v ) = ∣ ∣ v ∣ ∣ T(v)=\left| |v| \right| T(v)=∣∣v∣∣不是线性变换
- 以原点为轴的旋转是线性变换
- 导数算符是一种线性算子
矩阵如何描述线性变换
坐标与基
显然
A
(
⋅
)
A(\cdot)
A(⋅)是一个线性变换
但是矩阵
A
A
A如何描述一个变换呢?
T
(
v
)
=
A
v
T(v)=Av
T(v)=Av
矩阵
A
m
∗
n
A_{m*n}
Am∗n,描述了线性变换
T
(
∗
)
:
ℜ
n
→
ℜ
m
T(*):\ \real^n\rightarrow\real^m
T(∗): ℜn→ℜm(只考虑矩阵右乘)
T
(
v
1
)
T(v_1)
T(v1)可以描述线性变换对向量
v
1
v_1
v1的操作
T
(
v
2
)
T(v_2)
T(v2)可以描述线性变换对向量
v
2
v_2
v2的操作
如果假设两向量线性无关,那么就可以知道
T
T
T对
v
1
v_1
v1和
v
2
v_2
v2张成的整个空间的操作
所以我们如果有 T ( v 1 ) ⋯ T ( v n ) T(v_1)\cdots T(v_n) T(v1)⋯T(vn), v 1 ⋯ v n v_1\cdots v_n v1⋯vn构成了输入空间 R n \mathbb R^n Rn的一组基。那么整个线性变换就完全掌握了。
对于输入空间中的任意一个向量均有
v
=
c
1
v
1
+
c
2
v
2
+
⋯
+
c
n
v
n
v=c_1v_1+c_2v_2+\cdots+c_nv_n
v=c1v1+c2v2+⋯+cnvn
T
(
v
)
=
c
1
T
(
v
1
)
+
c
2
T
(
v
2
)
+
⋯
+
c
n
T
(
v
n
)
T(v)=c_1T(v_1)+c_2T(v_2)+\cdots+c_nT(v_n)
T(v)=c1T(v1)+c2T(v2)+⋯+cnT(vn)
可见如果空间中的一组基被确定了,那么向量
v
v
v的表示也就被唯一确定了
c
1
⋯
c
n
c_1\cdots c_n
c1⋯cn被称为向量
v
v
v在基
v
1
⋯
v
n
v_1\cdots v_n
v1⋯vn下的坐标值,坐标来源于基,而线性变换和向量本身于坐标无关
线性变换的矩阵表示
如果想通过矩阵确定一个线性变换,还缺什么
选取输入空间
R
n
\mathbb R^n
Rn一组基
v
1
⋯
v
n
v_1\cdots v_n
v1⋯vn,输出空间
R
m
\mathbb R^m
Rm的一组基
w
1
⋯
w
m
w_1\cdots w_m
w1⋯wm
T
(
v
)
=
c
1
T
(
v
1
)
+
c
2
T
(
v
2
)
+
⋯
+
c
n
T
(
v
n
)
=
T(v)=c_1T(v_1)+c_2T(v_2)+\cdots+c_nT(v_n)=
T(v)=c1T(v1)+c2T(v2)+⋯+cnT(vn)=
[
T
(
v
1
)
T
(
v
2
)
⋯
T
(
v
n
)
]
[
c
1
c
2
⋮
c
n
]
[T(v_1)\ T(v_2)\cdots T(v_n)] \left[ \begin{matrix} c_1\\ c_2\\ \vdots\\ c_n \end{matrix} \right]
[T(v1) T(v2)⋯T(vn)]⎣⎢⎢⎢⎡c1c2⋮cn⎦⎥⎥⎥⎤
[
T
(
v
1
)
T
(
v
2
)
⋯
T
(
v
n
)
]
[T(v_1)\ T(v_2)\cdots T(v_n)]
[T(v1) T(v2)⋯T(vn)]描述了这个线性变换
T ( v i ) T(v_i) T(vi)是输出空间 R m \mathbb R^m Rm的一个向量,在基 w 1 ⋯ w m w_1\cdots w_m w1⋯wm下它有一组坐标值为基 a 1 i ⋯ a m i a_{1i}\cdots a_{mi} a1i⋯ami
[
T
(
v
1
)
T
(
v
2
)
⋯
T
(
v
n
)
]
=
[
w
1
w
2
⋯
w
m
]
[
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
m
1
a
m
2
⋯
a
m
n
]
[T(v_1)\ T(v_2)\cdots T(v_n)]=[w_1\ w_2\cdots w_m] \left[ \begin{matrix} a_{11}&a_{12}&\cdots &a_{1n}\\ a_{21}&a_{22}&\cdots &a_{2n}\\ \vdots&\vdots&\ddots &\vdots\\ a_{m1}&a_{m2}&\cdots &a_{mn}\\ \end{matrix} \right]
[T(v1) T(v2)⋯T(vn)]=[w1 w2⋯wm]⎣⎢⎢⎢⎡a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎦⎥⎥⎥⎤
假设输出向量为
w
=
T
(
v
)
w=T(v)
w=T(v)
w
=
b
1
w
1
+
b
2
w
2
+
⋯
+
b
m
w
m
=
[
w
1
w
2
⋯
w
m
]
[
b
1
b
2
⋮
b
m
]
w=b_1w_1+b_2w_2+\cdots+b_mw_m=[w_1 w_2\cdots w_m] \left[ \begin{matrix} b_1\\ b_2\\ \vdots\\ b_m \end{matrix} \right]
w=b1w1+b2w2+⋯+bmwm=[w1w2⋯wm]⎣⎢⎢⎢⎡b1b2⋮bm⎦⎥⎥⎥⎤
最后
[
w
1
w
2
⋯
w
m
]
[
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
m
1
a
m
2
⋯
a
m
n
]
[
c
1
c
2
⋮
c
n
]
=
[
w
1
w
2
⋯
w
m
]
[
b
1
b
2
⋮
b
m
]
[w_1\ w_2\cdots w_m] \left[ \begin{matrix} a_{11}&a_{12}&\cdots &a_{1n}\\ a_{21}&a_{22}&\cdots &a_{2n}\\ \vdots&\vdots&\ddots &\vdots\\ a_{m1}&a_{m2}&\cdots &a_{mn}\\ \end{matrix} \right] \left[ \begin{matrix} c_1\\ c_2\\ \vdots\\ c_n \end{matrix} \right]= [w_1 w_2\cdots w_m] \left[ \begin{matrix} b_1\\ b_2\\ \vdots\\ b_m \end{matrix} \right]
[w1 w2⋯wm]⎣⎢⎢⎢⎡a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡c1c2⋮cn⎦⎥⎥⎥⎤=[w1w2⋯wm]⎣⎢⎢⎢⎡b1b2⋮bm⎦⎥⎥⎥⎤
[
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
m
1
a
m
2
⋯
a
m
n
]
[
c
1
c
2
⋮
c
n
]
=
[
b
1
b
2
⋮
b
m
]
\left[ \begin{matrix} a_{11}&a_{12}&\cdots &a_{1n}\\ a_{21}&a_{22}&\cdots &a_{2n}\\ \vdots&\vdots&\ddots &\vdots\\ a_{m1}&a_{m2}&\cdots &a_{mn}\\ \end{matrix} \right] \left[ \begin{matrix} c_1\\ c_2\\ \vdots\\ c_n \end{matrix} \right]= \left[ \begin{matrix} b_1\\ b_2\\ \vdots\\ b_m \end{matrix} \right]
⎣⎢⎢⎢⎡a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡c1c2⋮cn⎦⎥⎥⎥⎤=⎣⎢⎢⎢⎡b1b2⋮bm⎦⎥⎥⎥⎤
A
c
=
b
Ac=b
Ac=b
A
A
A在基
v
1
⋯
v
n
v_1\cdots v_n
v1⋯vn和
w
1
⋯
w
m
w_1\cdots w_m
w1⋯wm下描述了线性变换,
c
c
c是向量
v
v
v的坐标,
b
b
b是向量
w
=
T
(
v
)
w=T(v)
w=T(v)的坐标。
总之,矩阵 A A A的各列是输入空间各基经过线性变换后,在输出空间的一组基下的坐标
线性变换的几何图像
接下来,看一下
R
3
\mathbb R^3
R3空间的变换,在
R
3
\mathbb R^3
R3空间放置一个单位立方体,观察其在线性变化下的变化
恒等变换 I I I
[
1
0
0
0
1
0
0
0
1
]
\left[ \begin{matrix} 1&0&0\\ 0&1&0\\ 0&0&1 \end{matrix} \right]
⎣⎡100010001⎦⎤
在恒等变换下,所有向量均映射到自身,单位立方体不变
拉伸/压缩变换
[
a
0
0
0
1
0
0
0
1
]
\left[ \begin{matrix} a&0&0\\ 0&1&0\\ 0&0&1 \end{matrix} \right]
⎣⎡a00010001⎦⎤
一维拉伸/压缩变换对应的是行/列倍乘矩阵,可见当
0
<
a
<
1
0<a<1
0<a<1的时候为压缩变换,
a
a
a为压缩比;当
a
>
1
a>1
a>1的时候,为拉伸变换,
a
a
a为拉伸比。
而当
a
<
0
a<0
a<0的时候,为坐标面的镜像变换,和拉伸变换的合变换。
剪切变换 E E E
[
1
0
0
0
1
0
a
0
1
]
\left[ \begin{matrix} 1&0&0\\ 0&1&0\\ a&0&1 \end{matrix} \right]
⎣⎡10a010001⎦⎤
剪切变换对应的是行/列倍加矩阵
旋转变换 R R R
角速度在
x
x
x轴方向的旋转
[
1
0
0
0
c
o
s
θ
−
s
i
n
θ
0
s
i
n
θ
c
o
s
θ
]
\left[ \begin{matrix} 1&0&0\\ 0&cos\theta & -sin\theta \\ 0&sin\theta &cos\theta \end{matrix} \right]
⎣⎡1000cosθsinθ0−sinθcosθ⎦⎤
右下角的二阶子方阵为二维的旋转矩阵
角速度在
y
y
y轴方向的旋转
[
c
o
s
θ
0
s
i
n
θ
0
1
0
−
s
i
n
θ
0
c
o
s
θ
]
\left[ \begin{matrix} cos\theta& 0&sin\theta\\ 0& 1& 0\\ -sin\theta &0&cos\theta \end{matrix} \right]
⎣⎡cosθ0−sinθ010sinθ0cosθ⎦⎤
角速度在
z
z
z轴方向上的旋转
[
c
o
s
θ
−
s
i
n
θ
0
s
i
n
θ
c
o
s
θ
0
0
0
1
]
\left[ \begin{matrix} cos\theta& -sin\theta&0\\ sin\theta& cos\theta&0\\ 0&0&1 \end{matrix} \right]
⎣⎡cosθsinθ0−sinθcosθ0001⎦⎤
其他所有旋转都可以由这三种旋转组合生成
单位正交矩阵 R R R
旋转矩阵都是单位正交矩阵,但是除了单位正交矩阵,单位正交矩阵对应的线性变换还有恒等变换,镜像变换。
正交矩阵则是个更大的家族,允许对向量的长度进行拉伸或压缩。
投影矩阵
下面有向量场,是
z
=
x
2
+
y
2
z=x^2+y^2
z=x2+y2的梯度场(将向量分布于平面
z
=
x
−
y
z=x-y
z=x−y上),如何把
∇
z
\nabla z
∇z投影到平面
z
=
x
−
y
z=x-y
z=x−y上?
投影矩阵
A
(
A
T
A
)
−
1
A
T
A(A^TA)^{-1}A^T
A(ATA)−1AT
下面的问题是如何确定
A
A
A,
C
(
A
)
=
{
v
∣
v
3
=
v
1
−
v
2
}
C(A)=\{v|v_3=v_1-v_2\}
C(A)={v∣v3=v1−v2}
随便找两个平面上的不线性相关的向量,组成矩阵
A
=
[
1
0
0
1
1
−
1
]
A= \left[ \begin{matrix} 1&0\\ 0&1\\ 1&-1 \end{matrix} \right]
A=⎣⎡10101−1⎦⎤
构造投影矩阵
P
=
A
(
A
T
A
)
−
1
A
T
=
[
2
/
3
1
/
3
1
/
3
1
/
3
2
/
3
−
1
/
3
1
/
3
−
1
/
3
2
/
3
]
P=A(A^TA)^{-1}A^T= \left[ \begin{matrix} 2/3&1/3&1/3\\ 1/3&2/3&-1/3\\ 1/3&-1/3&2/3 \end{matrix} \right]
P=A(ATA)−1AT=⎣⎡2/31/31/31/32/3−1/31/3−1/32/3⎦⎤
P
P
P左乘向量场中各向量后
秩的含义
矩阵的秩在线性变换中代表着变换后的空间的维数,如上面的投影矩阵,秩为2,而线性变换后的输出空间也为2(但是注意,输出空间还在 R 3 \mathbb R^3 R3中)。
矩阵乘法的意义
矩阵乘法其实是依照一定次序的线性变换的合变换。
这样的旋转是怎么生成的?
它是把立方体的空间对角线旋转至与
z
z
z轴重合,然后进行
z
z
z轴的旋转
首先,以
x
x
x轴为轴旋转
45
°
45\degree
45°,将一条棱放在
x
O
z
xOz
xOz做表面上
然后以
y
y
y轴为轴旋转
−
a
r
c
t
a
n
(
1
2
)
r
a
d
-arctan(\frac{1}{\sqrt 2})\ rad
−arctan(21) rad
然后乘以
z
z
z轴的旋转矩阵
如果上面的三个矩阵交换次序是无法得出一样得结果的,这是从几何意义上讲为什么矩阵乘法不能交换次序。
逆变换与矩阵积的求逆法则
A − 1 A = I A^{-1}A=I A−1A=I,经过矩阵和其逆的共同作用,一切恢复了原样(恒等变换),矩阵逆代表的是其逆变换
接着上面的例子,如果想将对角线恢复到原来的位置,但是保持旋转,需要做什么
记得最开始在施加旋转效果之前,有两个常旋转矩阵,只需要按步骤依次将这两个矩阵消除即可。
所以首先,以
y
y
y轴为轴旋转
a
r
c
t
a
n
(
1
2
)
r
a
d
arctan(\frac{1}{\sqrt 2})\ rad
arctan(21) rad
然后以
x
x
x轴为轴旋转
−
45
°
-45\degree
−45°
(
A
B
)
−
1
=
B
−
1
A
−
1
(AB)^{-1}=B^{-1}A^{-1}
(AB)−1=B−1A−1
这个道理就像俄罗斯套娃,必须把外层的先打开,才能继续打开里面的
基变换
在本文开头,已经知道一个线性变换只有在基给定的情况下,矩阵才能描述一个线性变换,但是对于同一线性变换,不同基的形式之间有什么联系?
先考虑一个向量
v
v
v在不同的基下,坐标之间有什么联系
假设旧基为
x
1
x
2
⋯
x
n
x_1\ x_2\cdots x_n
x1 x2⋯xn,这组基下
v
v
v的坐标为
α
1
α
2
⋯
α
n
\alpha_1\ \alpha_2\cdots \alpha_n
α1 α2⋯αn,新基为
y
1
y
2
⋯
y
n
y_1\ y_2\cdots y_n
y1 y2⋯yn,这组基下
v
v
v的坐标为
β
1
β
2
⋯
β
n
\beta_1\ \beta_2\cdots \beta_n
β1 β2⋯βn
v
=
α
1
x
1
+
α
2
x
2
+
⋯
+
α
n
x
n
=
β
1
y
1
+
β
2
y
2
+
⋯
+
β
n
y
n
v=\alpha_1x_1+\alpha_2x_2+\cdots+\alpha_nx_n=\beta_1y_1+\beta_2y_2+\cdots+\beta_ny_n
v=α1x1+α2x2+⋯+αnxn=β1y1+β2y2+⋯+βnyn
v
=
[
x
1
x
2
⋯
x
n
]
[
α
1
α
2
⋮
α
n
]
=
[
y
1
y
2
⋯
y
n
]
[
β
1
β
2
⋮
β
n
]
v=\left[x_1\ x_2\cdots x_n\right] \left[ \begin{matrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{matrix} \right]= \left[y_1\ y_2\cdots y_n\right] \left[ \begin{matrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{matrix} \right]
v=[x1 x2⋯xn]⎣⎢⎢⎢⎡α1α2⋮αn⎦⎥⎥⎥⎤=[y1 y2⋯yn]⎣⎢⎢⎢⎡β1β2⋮βn⎦⎥⎥⎥⎤
假设
y
i
y_i
yi的
x
1
x
2
⋯
x
n
x_1\ x_2\cdots x_n
x1 x2⋯xn线性表示为
y
i
=
w
i
1
x
i
+
w
i
2
x
i
+
⋯
+
w
i
n
x
i
y_i=w_{i1}x_i+w_{i2}x_i+\cdots +w_{in}x_i
yi=wi1xi+wi2xi+⋯+winxi
[
x
1
x
2
⋯
x
n
]
[
w
11
w
12
⋯
w
1
n
w
21
w
22
⋯
w
2
n
⋮
⋮
⋱
⋮
w
n
1
w
n
2
⋯
w
n
n
]
=
[
y
1
y
2
⋯
y
n
]
[x_1\ x_2\cdots x_n] \left[ \begin{matrix} w_{11}&w_{12}&\cdots &w_{1n}\\ w_{21}&w_{22}&\cdots &w_{2n}\\ \vdots&\vdots&\ddots &\vdots\\ w_{n1}&w_{n2}&\cdots &w_{nn}\\ \end{matrix} \right]= [y_1 y_2\cdots y_n]
[x1 x2⋯xn]⎣⎢⎢⎢⎡w11w21⋮wn1w12w22⋮wn2⋯⋯⋱⋯w1nw2n⋮wnn⎦⎥⎥⎥⎤=[y1y2⋯yn]
v
=
[
x
1
x
2
⋯
x
n
]
[
α
1
α
2
⋮
α
n
]
=
[
x
1
x
2
⋯
x
n
]
[
w
11
w
12
⋯
w
1
n
w
21
w
22
⋯
w
2
n
⋮
⋮
⋱
⋮
w
n
1
w
n
2
⋯
w
n
n
]
[
β
1
β
2
⋮
β
n
]
v=\left[x_1\ x_2\cdots x_n\right] \left[ \begin{matrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{matrix} \right]= [x_1\ x_2\cdots x_n] \left[ \begin{matrix} w_{11}&w_{12}&\cdots &w_{1n}\\ w_{21}&w_{22}&\cdots &w_{2n}\\ \vdots&\vdots&\ddots &\vdots\\ w_{n1}&w_{n2}&\cdots &w_{nn}\\ \end{matrix} \right] \left[ \begin{matrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{matrix} \right]
v=[x1 x2⋯xn]⎣⎢⎢⎢⎡α1α2⋮αn⎦⎥⎥⎥⎤=[x1 x2⋯xn]⎣⎢⎢⎢⎡w11w21⋮wn1w12w22⋮wn2⋯⋯⋱⋯w1nw2n⋮wnn⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡β1β2⋮βn⎦⎥⎥⎥⎤
[
α
1
α
2
⋮
α
n
]
=
[
w
11
w
12
⋯
w
1
n
w
21
w
22
⋯
w
2
n
⋮
⋮
⋱
⋮
w
n
1
w
n
2
⋯
w
n
n
]
[
β
1
β
2
⋮
β
n
]
\left[ \begin{matrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{matrix} \right]= \left[ \begin{matrix} w_{11}&w_{12}&\cdots &w_{1n}\\ w_{21}&w_{22}&\cdots &w_{2n}\\ \vdots&\vdots&\ddots &\vdots\\ w_{n1}&w_{n2}&\cdots &w_{nn}\\ \end{matrix} \right] \left[ \begin{matrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{matrix} \right]
⎣⎢⎢⎢⎡α1α2⋮αn⎦⎥⎥⎥⎤=⎣⎢⎢⎢⎡w11w21⋮wn1w12w22⋮wn2⋯⋯⋱⋯w1nw2n⋮wnn⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡β1β2⋮βn⎦⎥⎥⎥⎤
α
=
W
β
\alpha=W\beta
α=Wβ
综上,如果新基等于旧基和旧基关系如下
[
y
1
y
2
⋯
y
n
]
=
[
x
1
x
2
⋯
x
n
]
W
[y_1\ y_2\cdots y_n]=[x_1\ x_2\cdots x_n]W
[y1 y2⋯yn]=[x1 x2⋯xn]W
上式称为基变换
如果
v
v
v
在基
y
1
y
2
⋯
y
n
y_1\ y_2\cdots y_n
y1 y2⋯yn的坐标为
β
1
β
2
⋯
β
n
\beta_1\ \beta_2\cdots \beta_n
β1 β2⋯βn,
在基
x
1
x
2
⋯
x
n
x_1\ x_2\cdots x_n
x1 x2⋯xn的坐标为
α
1
α
2
⋯
α
n
\alpha_1\ \alpha_2\cdots \alpha_n
α1 α2⋯αn
那么两组坐标的关系是
α
=
W
β
\alpha=W\beta
α=Wβ
或表示成
[
v
]
x
=
W
[
v
]
y
[v]_x=W[v]_y
[v]x=W[v]y
称为坐标变换,
W
W
W称为过渡矩阵
再议相似性
回到本节最开始的问题,在不同的基下,相同线性变换的矩阵有什么联系?
首先应该重申一下,相似矩阵是方阵中的概念
方阵就意味着输入空间和输出空间是同一个空间
有基变换
[
y
1
y
2
⋯
y
n
]
=
[
x
1
x
2
⋯
x
n
]
W
[y_1\ y_2\cdots y_n]=[x_1\ x_2\cdots x_n]W
[y1 y2⋯yn]=[x1 x2⋯xn]W
向量
v
v
v的坐标变换为
α
=
W
β
\alpha=W\beta
α=Wβ
向量
T
(
v
)
T(v)
T(v)的坐标变换为
γ
=
W
δ
\gamma=W\delta
γ=Wδ
线性变换矩阵
[
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
⋯
a
n
n
]
[
α
1
α
2
⋮
α
n
]
=
[
γ
1
γ
2
⋮
γ
n
]
\left[ \begin{matrix} a_{11}&a_{12}&\cdots &a_{1n}\\ a_{21}&a_{22}&\cdots &a_{2n}\\ \vdots&\vdots&\ddots &\vdots\\ a_{n1}&a_{n2}&\cdots &a_{nn}\\ \end{matrix} \right] \left[ \begin{matrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{matrix} \right]= \left[ \begin{matrix} \gamma_1\\ \gamma_2\\ \vdots\\ \gamma_n \end{matrix} \right]
⎣⎢⎢⎢⎡a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡α1α2⋮αn⎦⎥⎥⎥⎤=⎣⎢⎢⎢⎡γ1γ2⋮γn⎦⎥⎥⎥⎤
什么样的矩阵
B
B
B可以满足
B
[
β
1
β
2
⋮
β
n
]
=
[
δ
1
δ
2
⋮
δ
n
]
B \left[ \begin{matrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{matrix} \right]= \left[ \begin{matrix} \delta_1\\ \delta_2\\ \vdots\\ \delta_n \end{matrix} \right]
B⎣⎢⎢⎢⎡β1β2⋮βn⎦⎥⎥⎥⎤=⎣⎢⎢⎢⎡δ1δ2⋮δn⎦⎥⎥⎥⎤
B
W
−
1
[
α
1
α
2
⋮
α
n
]
=
W
−
1
[
γ
1
γ
2
⋮
γ
n
]
BW^{-1} \left[ \begin{matrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{matrix} \right]=W^{-1} \left[ \begin{matrix} \gamma_1\\ \gamma_2\\ \vdots\\ \gamma_n \end{matrix} \right]
BW−1⎣⎢⎢⎢⎡α1α2⋮αn⎦⎥⎥⎥⎤=W−1⎣⎢⎢⎢⎡γ1γ2⋮γn⎦⎥⎥⎥⎤
所以矩阵
A
,
B
A,B
A,B的关系为
B
=
W
−
1
A
W
B=W^{-1}AW
B=W−1AW
这正是相似矩阵的定义式
特征基和对角化
可对角化的矩阵是相似于对角阵的矩阵
Λ
=
S
−
1
A
S
\Lambda=S^{-1}AS
Λ=S−1AS
如果以基变换的角度来审视对角化
A
A
A描述了某基下的线性变换,有特征向量矩阵
S
S
S,也是从现有基过渡到特征基的过渡矩阵。
为什么要选取特征基,线性变换在特征基下可以表示成对角阵,其在多次线性变换后基不会偏离原来的方向,各坐标之间不会相互耦合。
[
1.5
2
3
]
a
\left[ \begin{matrix} 1.5&&\\ &2&\\ &&3\\ \end{matrix} \right]^a
⎣⎡1.523⎦⎤a