线性转化
转化的直观理解
转化是函数映射的另一种表达,与函数一样,转化通过计算,将输入映射到输出:
5 2 − 3 → f ( x ) → 25 4 9 \begin{matrix}5\\2\\-3\end{matrix}\to f(x)\to\begin{matrix}25\\4\\9\end{matrix} 52−3→f(x)→2549
将输入输出都用向量的形式来表示:
[ 5 7 ] V e c t o r i n p u t → L ( V → ) → [ 2 − 3 ] V e c t o r o u t p u t \begin{matrix}\begin{bmatrix}5\\7\\\end{bmatrix}\\Vector\,input\end{matrix}\to L(\overrightarrow{V})\to\begin{matrix}\begin{bmatrix}2\\-3\\\end{bmatrix}\\Vector\,output\end{matrix} [57]Vectorinput→L(V)→[2−3]Vectoroutput
转化这个词暗含着运动这一概念,像下面这个例子,两个向量分别是转化的输入和输出:
我们可以想象这个运动的过程:
为了从整体来理解这个运动的概念,我们可以假设在二维空间中的每一个向量都进行这这样的运动过程:
我们将每个向量抽象为一个点,这个点就是之前箭头的顶点,这样可以更直观地理解转化过程:
此时对于空间中的任何一个向量进行的一次转化,都可以理解为现在每个向量抽象成的点转化为另一个点。
在二维空间时,为了对整个转化的“形状”有更好的理解,我们可以将整个空间抽象成一个二维的表格:
保留原表格有助于我们追踪变化的开始和结束:
线性的限定条件
转化可以很复杂,但是线性代数将转化局限在了linear(线性)这一类型。
一个线性转化有如下两个性质:
- 所有的直线在转化后仍需保证为直线,不能变为曲线
- 原点必须维持原位
如下的例子中,直线转化变为了曲线,因此不是线性转化:
而在下面的例子中,原点发生了改变,因此也不是线性转化:
经由上面两个性质可以得到,线性变化后的网格会保持平行和均匀分布:
虽然有些的线性变化可以用语言描述,比如旋转等。但大部分线性变化还是很难用语言来形容,因此需要用一些数字特性来描述线性变化的过程。这个数字特性可以用 i → \overrightarrow{i} i和 j → \overrightarrow{j} j的变化来表示。其他所有的变化都和这两个基础向量有关。
假设我们存在如下一个向量 v → \overrightarrow{v} v:
现在我们进行线性变换并追踪这三个变量(包括两个基向量)的变化:
因为表格现在还是平行和均匀分布的,所以我们可以发现一个很重要的规律:
对于转化后的两个基向量和
v
→
\overrightarrow{v}
v ,他们之前的线性关系现在仍然存在。这意味着可以从变化后的
i
→
\overrightarrow{i}
i和
j
→
\overrightarrow{j}
j 推断出
v
→
\overrightarrow{v}
v
而转化后的
i
→
\overrightarrow{i}
i和
j
→
\overrightarrow{j}
j对应于之前的基向量可以得到如下的关系 :
所以对于原基向量表示下的任何向量,只要知道转化后的基向量的坐标,就可以推导出转化后的任何向量的坐标:
还是以上图为例子,假如转化后:
i → → [ 1 − 2 ] j → → [ 3 0 ] \overrightarrow{i}\to\begin{bmatrix}1\\-2\end{bmatrix}\qquad\overrightarrow{j}\to\begin{bmatrix}3\\0\end{bmatrix} i→[1−2]j→[30]
现在对于任何的向量 ( x , y ) (x,y) (x,y),都有如下的转化过程成立:
[ x y ] → x [ 1 − 2 ] + y [ 3 0 ] = [ 1 x + 3 y − 2 x + 0 y ] \begin{bmatrix}x\\y\end{bmatrix}\to x\begin{bmatrix}1\\-2\end{bmatrix}+y\begin{bmatrix}3\\0\end{bmatrix}=\begin{bmatrix}1x+3y\\-2x+0y\end{bmatrix} [xy]→x[1−2]+y[30]=[1x+3y−2x+0y]
所以现在给定任何一个向量,都可以用上面的等式来计算得到转化后的向量。
从上面的讨论,我们可以看出一个二维的线性转化过程可以由四个数字来表示,那就是 i → \overrightarrow{i} i和 j → \overrightarrow{j} j转化后的坐标 [ 1 − 2 ] \begin{bmatrix}1\\-2\end{bmatrix} [1−2]和 [ 3 0 ] \begin{bmatrix}3\\0\end{bmatrix} [30]
将这个两个坐标打包成一个2*2的矩阵,我们可以得到 [ 3 2 − 2 1 ] \begin{bmatrix}3&&2\\-2&&1\end{bmatrix} [3−221]
通用情况:
实例动态图演示:
所以当以后我们遇到一个矩阵的时候,我们可以将这个矩阵解释为一种特定的转化