小结
- 矩阵变化的定义
- 线性变化的定义
矩阵方程
A
x
=
b
\boldsymbol{Ax}=\boldsymbol{b}
Ax=b和对应的向量方程
x
1
a
1
+
⋯
+
x
n
a
n
=
b
x_1\boldsymbol{a_1}+\cdots+x_n\boldsymbol{a_n}=\boldsymbol{b}
x1a1+⋯+xnan=b之间的差别仅仅是记号上的不同。然而矩阵方程
A
x
=
b
\boldsymbol{Ax}=\boldsymbol{b}
Ax=b出现在线性代数和应用中并不仅仅是直接与向量的线性组合问题有关。通常的情况是把矩阵
A
\boldsymbol{A}
A当作一个对象,它通过乘法“作用”于向量
x
\boldsymbol{x}
x,产生新的向量称为
A
x
\boldsymbol{Ax}
Ax。
[
4
−
3
1
3
2
0
5
1
]
[
1
1
1
1
]
=
[
5
8
]
[
4
−
3
1
3
2
0
5
1
]
[
1
4
−
1
3
]
=
[
0
0
]
\begin{bmatrix}4 & -3 & 1 & 3 \\ 2 & 0 & 5 & 1\end{bmatrix}\begin{bmatrix}1 \\ 1 \\ 1 \\ 1\end{bmatrix}=\begin{bmatrix}5 \\ 8\end{bmatrix} \\ \begin{bmatrix}4 & -3 & 1 & 3 \\ 2 & 0 & 5 & 1\end{bmatrix}\begin{bmatrix}1 \\ 4 \\ -1 \\ 3\end{bmatrix}=\begin{bmatrix}0 \\ 0\end{bmatrix}
[42−301531]⎣⎢⎢⎡1111⎦⎥⎥⎤=[58][42−301531]⎣⎢⎢⎡14−13⎦⎥⎥⎤=[00]
由这个新观点,若
A
=
[
4
−
3
1
3
2
0
5
1
]
\boldsymbol{A}=\begin{bmatrix}4 & -3 & 1 & 3 \\ 2 & 0 & 5 & 1\end{bmatrix}
A=[42−301531],解方程
A
x
=
b
\boldsymbol{Ax}=\boldsymbol{b}
Ax=b可解释为:求出
R
4
\mathbb{R}^{4}
R4中所有经过乘以
A
\boldsymbol{A}
A的“作用”后变成为
R
2
\mathbb{R}^{2}
R2中
b
\boldsymbol{b}
b的向量
x
\boldsymbol{x}
x。
由
x
\boldsymbol{x}
x到
A
x
\boldsymbol{Ax}
Ax的对应是由一个向量集到另一个向量集的函数。这个概念推广了通常的函数概念,通常的函数是把一个实数变为另一个实数的规则。
由
R
n
\mathbb{R}^{n}
Rn到
R
m
\mathbb{R}^{m}
Rm的一个变换(或函数、映射)
T
\boldsymbol{T}
T是一个规则,它把
R
n
\mathbb{R}^{n}
Rn中每个向量
x
\boldsymbol{x}
x对应以
R
m
\mathbb{R}^{m}
Rm中一个向量
T
(
x
)
\boldsymbol{T(x)}
T(x)。集
R
n
\mathbb{R}^{n}
Rn称为
T
\boldsymbol{T}
T的定义域,而
R
m
\mathbb{R}^{m}
Rm称为
T
\boldsymbol{T}
T的余定义域(或取值空间).符号
T
\boldsymbol{T}
T:
R
n
→
R
m
\mathbb{R}^{n}\rightarrow\mathbb{R}^{m}
Rn→Rm说明
T
\boldsymbol{T}
T的定义域是
R
n
\mathbb{R}^{n}
Rn而余定义域是
R
m
\mathbb{R}^{m}
Rm。对于
R
n
\mathbb{R}^{n}
Rn中向量
x
\boldsymbol{x}
x,
R
m
\mathbb{R}^{m}
Rm中向量
T
(
x
)
\boldsymbol{T(x)}
T(x)称为
x
\boldsymbol{x}
x(在
T
\boldsymbol{T}
T作用下)的像。所有像
T
(
x
)
\boldsymbol{T(x)}
T(x)的集合称为
T
\boldsymbol{T}
T的值域。
矩阵变换
对 R n \mathbb{R}^{n} Rn中每个 x \boldsymbol{x} x, T ( x ) \boldsymbol{T(x)} T(x)由 A x \boldsymbol{Ax} Ax计算得到,其中 A \boldsymbol{A} A是 m × n m \times n m×n矩阵。为简单起见,有时将这样一个矩阵变换记为 x ↦ A x \boldsymbol{x}\mapsto\boldsymbol{Ax} x↦Ax。注意当 A \boldsymbol{A} A有 n n n列时, T \boldsymbol{T} T的定义域为 R n \mathbb{R}^{n} Rn,而当 A \boldsymbol{A} A的每个列有 m m m个元素时, T \boldsymbol{T} T的余定义域为 R m \mathbb{R}^{m} Rm。 T \boldsymbol{T} T的值域为 A \boldsymbol{A} A的列的所有线性组合的集合,因为每个像 T ( x ) \boldsymbol{T(x)} T(x)有 A x \boldsymbol{Ax} Ax的形式。
设
A
=
[
1
−
3
3
5
−
1
7
]
,
u
=
[
2
−
1
]
,
b
=
[
3
2
5
]
,
c
=
[
3
2
−
5
]
\boldsymbol{A}=\begin{bmatrix}1 & -3 \\ 3 & 5 \\ -1 & 7\end{bmatrix},\boldsymbol{u}=\begin{bmatrix}2 \\ -1\end{bmatrix},\boldsymbol{b}=\begin{bmatrix}3 \\ 2 \\ 5\end{bmatrix},\boldsymbol{c}=\begin{bmatrix}3 \\ 2 \\ -5\end{bmatrix}
A=⎣⎡13−1−357⎦⎤,u=[2−1],b=⎣⎡325⎦⎤,c=⎣⎡32−5⎦⎤,定义变换
T
\boldsymbol{T}
T:
R
2
→
R
3
\mathbb{R}^{2}\rightarrow\mathbb{R}^{3}
R2→R3为
T
(
x
)
=
A
x
\boldsymbol{T(x)}=\boldsymbol{Ax}
T(x)=Ax,于是
T
(
x
)
=
A
x
=
[
1
−
3
3
5
−
1
7
]
[
x
1
x
2
]
=
[
x
1
−
3
x
2
3
x
1
+
5
x
2
−
x
1
+
7
x
2
]
\boldsymbol{T(x)}=\boldsymbol{Ax}=\begin{bmatrix}1 & -3 \\ 3 & 5 \\ -1 & 7\end{bmatrix}\begin{bmatrix}x_1 \\ x_2\end{bmatrix}=\begin{bmatrix}x_1-3x_2 \\ 3x_1+5x_2 \\ -x_1+7x_2\end{bmatrix}
T(x)=Ax=⎣⎡13−1−357⎦⎤[x1x2]=⎣⎡x1−3x23x1+5x2−x1+7x2⎦⎤
- 求 u \boldsymbol{u} u在变换 T \boldsymbol{T} T下的像 T ( u ) \boldsymbol{T(u)} T(u)
- 求 R 2 \mathbb{R}^{2} R2中的向量 x \boldsymbol{x} x,使 x \boldsymbol{x} x在 T \boldsymbol{T} T下的像是向量 b \boldsymbol{b} b
- 是否有其他向量在 T \boldsymbol{T} T下的像是向量 b \boldsymbol{b} b?
- 确定
c
\boldsymbol{c}
c是否属于变换
T
\boldsymbol{T}
T的值域
解:- T ( u ) = [ 1 − 3 3 5 − 1 7 ] [ 2 − 1 ] = [ 5 1 − 9 ] \boldsymbol{T(u)}=\begin{bmatrix}1 & -3 \\ 3 & 5 \\ -1 & 7\end{bmatrix}\begin{bmatrix}2 \\ -1\end{bmatrix} =\begin{bmatrix}5 \\ 1 \\ -9 \end{bmatrix} T(u)=⎣⎡13−1−357⎦⎤[2−1]=⎣⎡51−9⎦⎤
- 解
T
(
x
)
=
b
\boldsymbol{T(x)}=\boldsymbol{b}
T(x)=b,即解
A
x
=
b
\boldsymbol{Ax}= \boldsymbol{b}
Ax=b。
将增广矩阵进行行化简:
[ 1 − 3 3 3 5 2 − 1 7 − 5 ] \begin{bmatrix}1 & -3 & 3 \\ 3 & 5 & 2 \\ -1 & 7 & -5\end{bmatrix} ⎣⎡13−1−35732−5⎦⎤~ [ 1 − 3 3 0 14 − 7 0 4 − 2 ] \begin{bmatrix}1 & -3 & 3 \\ 0 & 14 & -7 \\ 0 & 4 & -2\end{bmatrix} ⎣⎡100−31443−7−2⎦⎤~ [ 1 − 3 3 0 1 − 0.5 0 0 0 ] \begin{bmatrix}1 & -3 & 3 \\ 0 & 1 & -0.5 \\ 0 & 0 & 0 \end{bmatrix} ⎣⎡100−3103−0.50⎦⎤
因此, x 1 = 1.5 , x 2 = 0.5 x_1=1.5,x_2=0.5 x1=1.5,x2=0.5。即 x = [ 1.5 − 0.5 ] \boldsymbol{x} = \begin{bmatrix} 1.5 \\ -0.5 \end{bmatrix} x=[1.5−0.5]在 T \boldsymbol{T} T下的像是给定的向量 b \boldsymbol{b} b - 由2)可知, A x = b \boldsymbol{Ax}= \boldsymbol{b} Ax=b的解是唯一的。所有仅有一个 x \boldsymbol{x} x使它的像是 b \boldsymbol{b} b。
- 若向量
c
\boldsymbol{c}
c是
R
2
\mathbb{R}^{2}
R2中某个
x
\boldsymbol{x}
x在
T
\boldsymbol{T}
T下的像,则需要有
x
\boldsymbol{x}
x,使方程
A
x
=
c
\boldsymbol{Ax}=\boldsymbol{c}
Ax=c有解。将
A
x
=
c
\boldsymbol{Ax}=\boldsymbol{c}
Ax=c的增广矩阵进行行化简:
[ 1 − 3 3 3 5 2 − 1 7 5 ] \begin{bmatrix} 1 & -3 & 3 \\ 3 & 5 & 2 \\ -1 & 7 & 5 \end{bmatrix} ⎣⎡13−1−357325⎦⎤~ [ 1 − 3 3 0 14 − 7 0 4 8 ] \begin{bmatrix}1 & -3 & 3 \\ 0 & 14 & -7 \\ 0 & 4 & 8\end{bmatrix} ⎣⎡100−31443−78⎦⎤~ [ 1 − 3 3 0 1 2 0 14 − 7 ] \begin{bmatrix}1 & -3 & 3 \\ 0 & 1 & 2 \\ 0 & 14 & -7\end{bmatrix} ⎣⎡100−311432−7⎦⎤~ [ 1 − 3 3 0 1 2 0 0 − 35 ] \begin{bmatrix}1 & -3 & 3 \\ 0 & 1 & 2 \\ 0 & 0 & -35 \end{bmatrix} ⎣⎡100−31032−35⎦⎤
第三个方程是0=-35,说明方程无解。因此 c \boldsymbol{c} c不属于 T \boldsymbol{T} T的值域。
若 A = [ 1 0 0 0 1 0 0 0 0 ] \boldsymbol{A}=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{bmatrix} A=⎣⎡100010000⎦⎤,则变换 x ↦ A x \boldsymbol{x}\mapsto\boldsymbol{Ax} x↦Ax是把 R 3 \mathbb{R}^{3} R3中的点投影到 x 1 x 2 x_1x_2 x1x2坐标平面上,因为 x ↦ A x = [ 1 0 0 0 1 0 0 0 0 ] [ x 1 x 2 x 3 ] = [ x 1 x 2 0 ] \boldsymbol{x}\mapsto\boldsymbol{Ax}=\begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{bmatrix}\begin{bmatrix} x_1 \\ x_2 \\ x_3\end{bmatrix}=\begin{bmatrix}x_1 \\ x_2 \\ 0\end{bmatrix} x↦Ax=⎣⎡100010000⎦⎤⎣⎡x1x2x3⎦⎤=⎣⎡x1x20⎦⎤
若 A = [ 1 0 3 1 ] \boldsymbol{A}=\begin{bmatrix} 1 & 0 \\ 3 & 1 \end{bmatrix} A=[1301],变换 T : R 2 → R 2 \boldsymbol{T}:\mathbb{R}^{2}\rightarrow\mathbb{R}^{2} T:R2→R2定义为 T x = A x \boldsymbol{Tx}=\boldsymbol{Ax} Tx=Ax,称为剪切变换。可以说明,若 T \boldsymbol{T} T作用一个正方形的各点,则像的集构成带阴影的平行四边形。关键的思想是证明 T \boldsymbol{T} T将线段映射称为线段,然后验证正方形的4个顶点映射成平行四边形的4个顶点。
线性变换
定义 变换(或映射) T \boldsymbol{T} T称为线性的,若
- 对 T \boldsymbol{T} T的定义域中一切 u , v \boldsymbol{u,v} u,v, T ( u + v ) = T ( u ) + T ( v ) \boldsymbol{T(u}+\boldsymbol{v)}=\boldsymbol{T(u)} + \boldsymbol{T(v)} T(u+v)=T(u)+T(v)
- 对 T \boldsymbol{T} T的定义域中一切 u \boldsymbol{u} u和数 c c c, T ( c u ) = c T ( u ) \boldsymbol{T(}c\boldsymbol{u)}=c\boldsymbol{T(u)} T(cu)=cT(u)。
线性变换保持向量的加法运算与标量乘法运算。
若 T \boldsymbol{T} T是线性变换,则 T ( 0 ) = 0 \boldsymbol{T(0)}=\boldsymbol{0} T(0)=0,且对 T \boldsymbol{T} T的定义域中一切向量 u \boldsymbol{u} u和 v \boldsymbol{v} v以及数 c c c和 d d d有: T ( c u + d v ) = c T ( u ) + d T ( v ) \boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)}=c\boldsymbol{T(u)}+d\boldsymbol{T(v)} T(cu+dv)=cT(u)+dT(v)。
对所有
u
,
v
\boldsymbol{u},\boldsymbol{v}
u,v和
c
,
d
c,d
c,d,若一个变换满足
T
(
c
u
+
d
v
)
=
c
T
(
u
)
+
d
T
(
v
)
\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)}=c\boldsymbol{T(u)}+d\boldsymbol{T(v)}
T(cu+dv)=cT(u)+dT(v),该变换必是线性的。
(若
c
=
d
=
1
c=d=1
c=d=1,可满足定义条件1;若
c
=
1
,
d
=
0
c=1,d=0
c=1,d=0,可满足定义条件2。)
重复应用
T
(
c
u
+
d
v
)
=
c
T
(
u
)
+
d
T
(
v
)
\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)}=c\boldsymbol{T(u)}+d\boldsymbol{T(v)}
T(cu+dv)=cT(u)+dT(v),得出推广:
T
(
c
1
v
1
+
⋯
+
c
p
v
p
)
=
c
1
T
(
v
1
)
+
⋯
+
c
p
T
(
v
p
)
\boldsymbol{T(}c_1\boldsymbol{v_1} + \cdots + c_p\boldsymbol{v_p)}=c_1\boldsymbol{T(v_1)}+\cdots+ c_p\boldsymbol{T(v_p)}
T(c1v1+⋯+cpvp)=c1T(v1)+⋯+cpT(vp)。该推广等式,在工程和物理中,称为叠加原理。
给定数
r
r
r,定义
T
:
R
2
→
R
2
\boldsymbol{T}:\mathbb{R}^{2}\rightarrow\mathbb{R}^{2}
T:R2→R2为
T
(
x
)
=
r
x
\boldsymbol{T(x)}=r\boldsymbol{x}
T(x)=rx,当
0
≤
r
≤
1
0 \leq r \leq 1
0≤r≤1时,
T
\boldsymbol{T}
T称为压缩变换;当
r
≥
1
r \geq 1
r≥1时,
T
\boldsymbol{T}
T称为拉伸变换。设
r
=
3
r = 3
r=3,证明
T
\boldsymbol{T}
T是线性变换。
解:设
u
,
v
\boldsymbol{u,v}
u,v属于
R
2
\mathbb{R}^{2}
R2,
c
,
d
c,d
c,d为数,则
T
(
c
u
+
d
v
)
=
3
(
c
u
+
d
v
)
=
3
c
u
+
3
d
v
=
c
(
3
u
)
+
d
(
3
v
)
=
c
T
(
u
)
+
d
T
(
v
)
\quad\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)} \\ = 3(c\boldsymbol{u} + d\boldsymbol{v}) \\ = 3c\boldsymbol{u} + 3d\boldsymbol{v} \\ = c(3\boldsymbol{u}) + d(3\boldsymbol{v})\\ = c\boldsymbol{T(u)}+d\boldsymbol{T(v)}
T(cu+dv)=3(cu+dv)=3cu+3dv=c(3u)+d(3v)=cT(u)+dT(v)
因满足
T
(
c
u
+
d
v
)
=
c
T
(
u
)
+
d
T
(
v
)
\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)}=c\boldsymbol{T(u)}+d\boldsymbol{T(v)}
T(cu+dv)=cT(u)+dT(v),故此变换必是线性的。
其实可以猜出矩阵
A
=
[
r
0
0
r
]
\boldsymbol{A}=\begin{bmatrix} r & 0 \\ 0 & r\end{bmatrix}
A=[r00r]。