在学习了很久的线性代数课程后,给定一个方阵,然后将其相似对角化,也许大多数同学都知道操作步骤,但是了解相似对角化背后的意义的人却微乎其微,因此本篇文章打算对相似对角化的意义做出解释。
一、矩阵的映射属性
在解析几何中,我们将既有大小,又有方向的量称之为向量。并且在不同的视角下,向量也可以有不同的表示方法,例如将它看成是空间中的一根带箭头的有向线段,或者是一个有序数组。在引入直角坐标系之后,两种表示法被有机的统一。
我们规定,两个长度和方向都一样的向量称为是相等向量。这意味着在空间中任意给定一个向量,我们总可以以坐标原点为起点作一个和它长度、方向都一样的向量;换句话说,如果将空间中所有向量的起点都移动到坐标原点,那么空间中任意一个点总会有唯一一个向量和它对应。因此该几何点的坐标也可以用来表征向量的坐标。
在空间中存在着很多对坐标点的操作,通过这些操作,我们可以将它从一个位置变到同一平面中的另一个位置,例如投影,旋转,伸缩等。这些操作都可以用一个统一的数学关系式:
这里a、b、c、d都是实数,给它们取不同的值,便可以表示一个特定的操作,我们称这种操作为线性变换,可以将其写为矩阵式,或者简写为
,这就类似于函数
,可以看到,给一个向量左乘一个矩阵后就可以将其变成另一个向量,这就初步揭示了矩阵的意义,也即它表示了一个特定的映射。
二、对角矩阵
既然我们的最终目的是介绍矩阵对角化的意义,那么就有必要先对对角矩阵作简要的介绍。通过查阅资料,我们知道:给定一个方阵,如果除了主对角线上的元素外的所有元素均为0(主对角元素也可以为0),那么该方阵即被称为对角矩阵,它的形式为。
我们已经知道,矩阵代表了一种映射,那么对角矩阵同样可以代表一种特殊的映射,写出该矩阵对应的映射式可得。可以看到,对角矩阵的每个元素分别作用于一个n维向量的不同分量上,这意味着对每个分量进行了一定的伸缩,因此,对角矩阵表示的映射就是伸缩映射。
三、矩阵的特征值和特征向量
给定矩阵,实数
以及非零向量
,如果满足
,就称
为
的特征值,
为特征值
对应的特征向量。
这里我们并不讲述如何求取矩阵的特征值与特征向量,而是对该定义背后的意义进行探索,我们知道,矩阵乘以一个向量就会把它变成另一个向量,因此假设,代入原式可得
。根据解析几何的知识,可以得到,向量
和
是共线的。
因此可以看出,经过矩阵映射后依然与本身共线的向量就是矩阵的特征向量,而比例系数就是特征值。
下面我们举一个例子:
给定矩阵,通过计算,可以求出它的特征值和特征向量分别为
,可以看到,这两个向量不共线(也即它们线性无关),因此就可以作为二维空间的一组基向量。
再给定向量,经过矩阵
映射后的向量变为
。
上面的坐标是我们以坐标轴的单位向量为基向量导出的向量坐标,下面我们以这两个特征向量为基,导出映射前后的两个向量在该基下的坐标,先求出过渡矩阵:
,解得
,可以求得:
、
,可以解得
、
。
这两个坐标就是以特征向量为基时导出的坐标,可以看到,如果以特征向量为基,那么一个向量经过该矩阵映射后,对应的坐标就进行了独立的伸缩变换,这里3和12就是属于向量的坐标,2和2是属于向量
的坐标,它们分别被扩大了4倍和1倍,刚好就是原矩阵的特征值。
因而这个矩阵作用在以它的特征向量为基表达的向量上,就会对该向量的分量进行伸缩变换,这比起一般的矩阵变换能省去很多步骤。
四、相似变换
根据线性代数的内容,我们知道,同一个线性变换在不同的基向量下的表征矩阵也是不同的。
假设给定基向量组和
,设有线性变换
,它在两组基下的矩阵分别用
和
表征,给定向量
,在
和
下的坐标分别用数组向量
和
表示,那么就有
,再设
到
的过渡矩阵为
,那么有
、
,向量
经过
作用后的向量坐标可表示为
,经过合理的运算,可得
,因此
和
是一对相似矩阵,因此相似矩阵就是同一线性变换在不同基向量下的不同矩阵表达。
再根据对角化的公式,这里
是
的特征向量组成的矩阵,再结合以上所讲的知识就可以想到,矩阵相似对角化的意义就是通过一个过渡矩阵
,将一个复杂的线性变换变为简单的伸缩变换,从而达到“以简代繁”的目的。