有没有人能用人类的语言告诉我,相似矩阵有什么用?

做论文需要用相似矩阵评估一个聚类模型。我不需要知道其数学原理,只要知道这东西是干什么用的。有人能告诉我么?
=====================
补充一下,我知道什么是相似矩阵,也知道其各种数学原理,但是我不明白这东西到底有什么用。换句话说,我想知道这东西在现实中能做什么。

比如,我去买菜,我可以用多元回归,分析出菜价和汽油价格成正比,那么油价涨了这几天,我知道菜价也会涨。我是想知道这样一个应用

 

默认排序​

马同学

马同学

看图学数学,公众号:matongxue314

1,543 人赞同了该回答

相似矩阵的定义是:

  A,B  都是  n  阶矩阵,若有可逆矩阵  P  ,使  P^{-1}AP=B  则称  B    A  的相似矩阵,或说  A    B  相似。----《线性代数》同济版

让我们从通俗解释开始。

1 通俗解释

今天《雷神3》上映了,我坐在第一排看电影:

而你坐在最后一排看电影:

我们看的是同一部电影,但是我们各自眼中看到的电影却因为位置不同而有所不同(比如清晰度啊、角度啊),所以说,“第一排看到的电影”和“最后一排看到的电影”是“相似”的。

那么相似矩阵走进的电影院,放映的是哪部电影?也就是说,什么是不变的呢?

是线性变换。

2 线性变换

什么是线性变换?让我们从函数说起。

2.1 线性函数

函数我们很早就接触了,直观地讲,就是把 x 轴上的点映射到曲线上(下面是函数y=sin(x) ,把 x 轴上的点映射到了正弦曲线上):

还有的函数,比如 y=x ,是把 x 轴上的点映射到直线上,我们称为线性函数:

2.2 从线性函数到线性变换

线性函数其实就是线性变换,为了看起来更像是线性变换,我换一种标记法。

比如之前的 y=x ,我们可以认为是把 (a,0) 点映射到 (0,a) 点,我们称为线性变换T ,记作:

T:(a,0)\to (0,a),a\in \mathbb {R},b\in \mathbb {R}\\

不过按照这个写法,作图就有点不一样了:

矩阵的形式很显然如下:

\begin{pmatrix} 0 \\ a \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ 0 \end{pmatrix}\\

这样做最直接的好处是,我们可以轻易的摆脱 x 轴的限制。

只要替换 (a,0) 为平面内所有的点 (a,b) ,我们就可以对整个平面做变换,该线性变换记作:

T:(a,b)\to (b,a)\\

进而可以写作矩阵的形式:

\begin{pmatrix} b \\ a \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix}\\

为了示意整个平面的点都被变换了,我用下面的淡蓝色网格来表示这个线性变换(这个变换实际上镜面反转,为了方便观察增加一个参考点 \vec{x_{}} 以及虚线表示的反转对称轴):

我们记:

\vec{y_{}}=\begin{pmatrix} b \\ a \end{pmatrix}\qquad \vec{x_{}}=\begin{pmatrix} a \\ b \end{pmatrix}\qquad A=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\\

我们可以得到更简便的记法(这种形式看起来也更像线性方程 y=ax ):

\vec{y_{}}=A\vec{x_{}}\\

反正 \vec{y_{}},\vec{x_{}} 都是指代的平面上所有的点,我们干脆更简化点,认为:

而 y=x 不过是这个 A 的一种特殊情况。

2.3 矩阵 A 与基

慢着!刚才的结论其实是不完整的,我们还少了一个信息。

y=x 是基于直角坐标系的,通过这个转换:

y=x\to A=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\\

得到的 A 也是基于直角坐标系的。

只是在线性变换中,我们不称为直角坐标系,我们叫做标准正交基。

标准正交基是 \{ \vec{i_{}}=\begin{pmatrix} 1 \\ 0 \end{pmatrix},\vec{j_{}}=\begin{pmatrix} 0 \\ 1 \end{pmatrix}\} ,它们所张成的线性空间如下(关于这幅图画的解释,可以参考 如何理解矩阵乘法? ):

A 在此基下,完成了镜面反转这个线性变换:

因此,让我们补完之前的结论:

看到这个结论,可能你会想,难道还可以在别的基下?在别的基下是什么情况啊?

好,终于到了我们本文的重点了。

3 相似矩阵

知道了线性变换,让我们回到文章开头就给出的隐喻,看电影。

线性变换就是电影院中播放的电影,不同的基坐在不同的位置观看:

同一部“电影”,不同基“看到”的就是不同的矩阵:

那怎么得到不同基下的矩阵呢?让我们来看看变换的细节。

3.1 细节

先上一张图,说明不同基下的矩阵的变换思路,这个图有点复杂,请参照之后的解释一起来看:

下面是对图的解释:

  • 有两个基: V_1:\{ \vec{i_{}},\vec{j_{}}\} 和 V_2:\{ \vec{i'},\vec{j'}\}
  • V1\to V2 ,可以通过 P^{-1} 转换
  • V2\to V1 ,可以通过 P 转换

整个转换的核心,就是上图正中的文字:

解释下:

  • \vec{v'} 是 V2 下的点
  • \vec{v'} 通过 P 变为 V1 下的点,即 P\vec{v'}
  • 在 V1 下,通过 A 矩阵完成线性变换,即 AP\vec{v'}
  • 通过 P^{-1} 从变回 V2 下的点,即 P^{-1}AP\vec{v'}

综上,我们可以有:

B\vec{v'}=P^{-1}AP\vec{v'}\\

我们可以认为:

B=P^{-1}AP\\

那么 B 和 A 互为相似矩阵。

那就还有一个细节了, V2\to V1 的转换矩阵 P ?

这个问题不复杂,只是坐标换来换去的,我尽量讲清楚。

首先我们给出空间中的一点,比如说 m 点吧:

相信大家可以理解,不论有没有基,这个点都是客观存在的。

然后,我们给出 m 点在 \vec{i'},\vec{j'} 的坐标 \vec{v'} :

为了表示 \vec{v'} 是 \vec{i'},\vec{j'} 下的坐标,我们写成这样:

\vec{v'}=\begin{pmatrix} a \\ b \end{pmatrix}=a\vec{i'}+b\vec{j'}\\

如果我们知道了 \vec{i'},\vec{j'} 在 \vec{i},\vec{j} 下的坐标:

那么有:

\begin{align*} \vec{v'} & = a\vec{i'}+b\vec{j'}\\ & = a(c\vec{i}+d\vec{j})+b(e\vec{i}+f\vec{j}) \end{align*}\\

此时,实际上 m 点的坐标,已经变到了 \vec{i},\vec{j} 下的 \vec{v} :

坐标已经转换了,继续往下推:

\begin{align*} \vec{v} & = a(c\vec{i}+d\vec{j})+b(e\vec{i}+f\vec{j})\\ & = \begin{pmatrix} c & e \\ d & f \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix}\\ & = \begin{pmatrix} \vec{i'} & \vec{j'} \end{pmatrix}\vec{v'} \\ & = P\vec{v'} \end{align*}\\

所以 P 其实就是:

P=\begin{pmatrix} \vec{i'} & \vec{j'} \end{pmatrix}\\

要记得啊,上面的 \vec{i'},\vec{j'} 是在 \vec{i},\vec{j} 下的坐标。

这里面稍微复杂点的就是,转换的时候要想清楚到底是在哪个基下!

为什么我们需要相似矩阵呢?我们来看看熟悉的极坐标。

3.2 极坐标

比如我把直角坐标系( xy 坐标系)的圆方程换元为极坐标( \rho \theta 坐标系)下:

x^2+y^2=a^2\implies \begin{cases} \rho =a\\ \theta \in \mathbb {R}\end{cases}\\

图像也从左边变为了右边:

换元之后是不是代数式和图像都变简单了。

相似矩阵的目的也是为了找到更简单的坐标系。

那么什么叫作简单的坐标系呢?

3.3 对角矩阵

比如这个 A 矩阵:

A=\begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix}\\

可以这样分解:

B=P^{-1}AP=\begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix}\\

其中 P=P^{-1}=\begin{pmatrix} -\frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \cr \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{pmatrix}

B 就是对角矩阵,看上去就很清爽,我认为这个就是简单的坐标系。

关于这方面更多的可以参看, 特征值、特征向量

编辑于 2017-11-13

​赞同 1.5K​​178 条评论

​分享

​收藏​感谢收起​

芥川倞

芥川倞

只懂点皮毛 / INFJ

13 人赞同了该回答

想到结论应该放在开头,不然别人没耐心看…结论是:为了对角化矩阵以用于“矩阵幂级数”的计算。详见下文。

-----------------------------------------

首先矩阵的内涵很丰富,在不同的背景下代表的问题不同,比如可以用来讨论线性方程组,可以用来讨论二次型,还可以用来讨论“线性变换”…而各个领域背景下的矩阵,代表的意义其实很不相同,很多学线性代数或高等代数的同学,如果没想通这一点,那就等着糊涂去吧...

 

那么说到“相似”这个概念源自哪里、最初属于哪一个背景谈论的概念:是“线性变换”。
而“线性变换”的内涵也很丰富(指线性空间到自身的线性映射),是“一类”运算的抽象。大家知道有很多运算都可以归类于线性运算,比如说常微分方程——求导就是线性运算——

 

而若把该运算作用的对象集体看作“向量”组成一个“线性空间”(常微分方程背景下的“函数”),

运算(求导运算,不只有一阶导 还可以是一阶二阶n阶导多少倍求和 是一个“算符”的概念)看作是对整个空间作用的一个“线性变换”,

接下来是令人惊奇的事——我们都知道空间中的对象(“向量”)可以选择一组基,从而用一个向量来表示 (唉…都是“向量”但意思不一样…前面指的是客观存在的那个对象,后面指的就是一组数排列成的“坐标”…一定要理解没有基是不存在后者意义的向量的,任何一个坐标向量,必暗含选定了一组基)

…好,那么令人惊奇的事是什么呢?
我们用一组基能表示这个空间里的对象没问题吧…因为“基”本身也是对象啊!只不过是被选出来作为表示其他对象的“代表”罢了;

可是如果我说,这个“线性变换”也能用这组基来表示,你会不会感到很惊奇?我第一次理解的时候反正是震惊了…太美妙太神奇了。

 

简单说一下操作吧…大概懂的能听明白,不懂的也听不明白 。

就是因为
①这个线性变换是作用于空间中所有对象的,所以自然也作用于基;
②基是可以表出空间中所有对象的,所以自然也可以表出经过线性变换作用后(根据线性变换的定义:仍在该空间里)的对象的

于是我们把“每一个”基向量被这个线性变换作用后得到的变换向量,再用同一组“整组基”表示出来,就可以用一个矩阵表示一个变换啦!!【严格一一对应的证明请参见教材】

这种对应就像向量和坐标向量的对应一样,只不过“运算”变成了“二维”,着实叹为观止。

 

能看到这的大概不多…觉得我跑题甚严重…不,你要想理解,不费点功夫就能理解的话,不早就出现在教科书上了么?世之奇伟、瑰怪,非常之观,常在于险远~

好了回到主题,换一组基,就可以把我们“算符”用矩阵表示的形式变得简单,像首赞马同学说的那样,没错:对角阵!

【换基之后空间中每一个向量的坐标会以新基为标准发生改变,同样地,同一个线性变换的矩阵也会以新基为标准发生改变,改变前后的关系,就是“相似”。
一句话:线性变换在换基前后的矩阵的关系叫做“相似”。
注意:正如向量坐标依赖于基的选择一样,“线性变换的矩阵”也是依赖于基的选择的,因为这个矩阵就像坐标,坐标是坐标,不是对象本身】

也就是说,只要“适当地”选择一组基,我们可以让该(非退化的)线性变换的矩阵“在该组基下”是对角阵。

 

说实在的,这大概是相似最大的一个功能了。在上面提到的(线性运算背景的)实际运算中,那些问题可以最终化归为某种形式的矩阵的运算。

而这些矩阵运算中很重要的便是 
\sum_{n=1}^{\infty}{k_n\cdot A^n} 这样的矩阵幂级数 (其中 k_n 为常数系数)

这个怎么做?
如果A是对角阵,好做吧?
那如果不是对角阵怎么破?
——利用相似,化成对角阵!
这就是传说中的“对角化方法”计算幂级数。

 

具体来说若找到了可逆矩阵P,使得
D=P^{-1}AP ,其中D是对角阵,那么…


A^n=(PDP^{-1})^n=
=PDP^{-1}PDP^{-1}...PDP^{-1}

 

根据矩阵乘法结合律,中间相邻的 P^{-1}P 都可以消掉,于是就剩下了开头和末尾的,以及中间的n个D:
A^n=PD^{n}P^{-1}

【P有求法的,其实是换基的过渡矩阵;求法就是先求特征值然后解出特征向量的那一套,最后把特征向量作为“列”排排站就是P】

 

代回到幂级数就得:
\sum_{n=1}^{\infty}{k_n\cdot A^n}=\sum_{n=1}^{\infty}{k_n\cdot (PD^{n}P^{-1})}

利用矩阵乘法分配律把可以收尾提出来:


\sum_{n=1}^{\infty}{k_n\cdot A^n}= P(\sum_{n=1}^{\infty}{k_n\cdot D^n)P^{-1}} 【最终结果】

厉害吧![\吐舌],

我们需要做的只是求出特征值(以组成对角阵D) 以及特征向量(对应特征值组成P)而已。

 

当然了,如果还有有心的童鞋继续问:为什么矩阵的幂级数重要呢?

那么这个问题,我以问作答:为什么在函数项级数中,幂级数重要呢?

一个道理 ; )

编辑于 2017-11-16

​赞同 13​​5 条评论

​分享

​收藏​感谢收起​

TheNewE

TheNewE

眼球自闭症/吃货/想做AI/来喝杯coffee吧

24 人赞同了该回答

建议你看一下孟岩的老三篇《理解矩阵》,
还有科学空间版的六篇《新理解矩阵》

分割线

现在有更好的东西了,b站上3blue1brown的熟肉,线性代数的直观理解

编辑于 2017-01-08

​赞同 24​​1 条评论

​分享

​收藏​感谢

王潜升

王潜升

11 人赞同了该回答

相似矩阵就是同一个线性变换在不同坐标基下的对应矩阵

编辑于 2017-10-11

​赞同 11​​添加评论

​分享

​收藏​感谢

蜂鸟

蜂鸟

云雀叫了一整天

16 人赞同了该回答

学线性代数时曾经看过人人网一篇文章,里面大致意思:矩阵的本质是运动的描述,那么用微积分来表达就是反应线性空间里的各种变换。对于线性变换选一组基就可以找一个矩阵来表达它,换一个基就可以用另一个矩阵来表达,如何判定这两个矩阵描述的是同一个线性变换呢?如何判定不同位置的人看到的电影屏幕画面是同一个电影?不同角度画的瓷器素描是否是同一个瓷器?两张照片一张特写猪屁股一张注重猪头,这两照片照的是同一只猪吗?这时相似矩阵就来了,如果得出是相似矩阵,那么我们就肯定同一个电影同一件瓷器照的同一只猪。
所以一句人话解释:相似矩阵来判断这一堆是否同一个东西或者同一个东西可以用哪些视角来看,我们选一个看起来最舒服的视角。比如一场空战,一份资料是基地指挥雷达上各个点的移动,一份是参战飞机自带摄像机的摄像,指挥官战后分析阵型肯定用前者,分析双方战斗素质等等肯定适合用后者。
我觉得学这玩意能看懂这个就行了

发布于 2017-05-28

​赞同 16​​2 条评论

​分享

​收藏​感谢收起​

王晨

王晨

游戏程序员,航空航天初级爱好者

132 人赞同了该回答

强势来答一波。推荐一个视频课程,叫做《线性代数的本质》来自 3Blue1Brown,绝壁秒杀"国产公式手册"级别的线性代数教材。

相信我,他会改变你对线性代数的根本性理解。

下面是B站视频链接

哔哩哔哩 ( ゜- ゜)つロ 乾杯~ Bilibili

 

PS:原答案“秒杀”一词居然引战了,数学爱好者们果然严谨啊。我就表达一下情感而已。

编辑于 2017-11-10

​赞同 132​​32 条评论

​分享

​收藏​感谢

Tam Alex

Tam Alex

三流大学讲师_四十三流吉他手

6 人赞同了该回答

说实话没看明白题主想问什么。。。

 

相似变换我见过最多的应用就是特征值分解。也就是构造一个变换矩阵(特征向量阵),找到一个相似对角阵(特征值对角阵)。

 

对一个矩阵进行特征值分解,得到它的特征值对角阵和特征向量矩阵,那么这个矩阵的所有性质不就明了了吗。

把矩阵看成线性变换的话,这个变换的方向,各方向上变换的大小(尺度)都一目了然。

 

然后像主成分分析啊、能观性能控性分析啊在此基础上就能够很容易的开展了。

 

所以题主不说怎么评估模型,我也不知道怎么进行下一步应用了。。。

发布于 2017-06-10

​赞同 6​​添加评论

​分享

​收藏​感谢

青春

青春

微信公众号:隔壁小王的睡前故事

15 人赞同了该回答

咱不扯什么线性变换,就从矩阵本身来说。
线性代数整个在干的事就是在各种意义下分类矩阵。没错,就这么回事,分类---分门别类。

这里“各种意义”是什么意思呢?如果你对数学比较熟悉的话,当我说到“分类”这个词时,你就肯定会想到另一个词“等价关系”。一种等价关系决定一种分类方法,反过来说也对。

相似就是一种等价关系,线代书上想必都是证明过这个结论的。所以,我们就可以愉快的用相似来对各种各样的矩阵进行分类啦。把所有相似的矩阵都给我放到一块,它们里面随便拿哪个出来都可以作为这一个类的代表,那我们当然就想找一个看着养眼(比较漂亮(๑> <๑))的矩阵来代表这个类啦。这个比较漂亮的矩阵就叫标准型,我们加上修饰语“相似”,就变成了相似标准型,没错,它就是我们早就知道的若尔当标准型。一个类里的矩阵必然有很多共性(不是一家人,不进一家门嘛),如前面有答主说的,迹啊,特征值啊,不变因子啊…很多东西都是相等的,这些叫作这个等价关系下的不变量。如果我们把这些不变量找全(或者其中起决定性的某几个不变量)了,那么根据不变量就能轻松识别哪些矩阵是相似的了。

其他的一些矩阵之间的关系也都可以作类似理解,例如相抵,合同等,就是从不同角度对矩阵分类…

现在回答题主问题,相似能用来干嘛?很简单嘛,能用来分类啊(咦,好像是废话…)面对纷繁复杂的世界,我们能做的不就是分类吗!

其实学到现在的数学,我越来越觉得很多数学本质上都是在做分类工作 →_→

欢迎指正|ω・)

编辑于 2017-05-26

​赞同 15​​4 条评论

​分享

​收藏​感谢

DMY

DMY

学生

6 人赞同了该回答

相似矩阵用途,就是把一个矩阵化简,让这矩阵的特点更加突出,找到这类矩阵相应的特征。比如说亚洲人的外貌,对个体来讲,每个亚洲人外貌特点都不一样,但可以通过相似比较得出,亚洲人特征是 黄皮肤,黑头发。
你的论文用聚类 可能是想看看先提取矩阵的特征,然后比较这些特征的相似性,相似度高的作为一类。

发布于 2012-09-28

​赞同 6​​添加评论

​分享

​收藏​感谢

Yuanning

Yuanning

Mind reader

45 人赞同了该回答

用通俗语言来讲,相似矩阵的用途,就是所谓把一个一般形式的新问题转化为一个已被解决过的“规范”问题,就像求解一元二次代数方程的时候我们把它化成一般形式然后套用求根公式一样。

对于相似矩阵的数学解释可以参考任意一本线性代数课本。相似矩阵可以视作同一个线性变换在不同基上的不同形式。
若两个矩阵相似,则这两个矩阵具有秩相等,行列式相等,迹相等,初等因子相等,特征值相等,特征多项式相等,等等一些很好的特性。所以当我们研究一个一般形式的矩阵的时候,如果可以找到与它相似的一些标准形式,就可以将任意矩阵的问题转化为一些固定形式的问题。比如对于可对角化的矩阵,可以研究与其相似的对角阵;对于一般的复数域上的矩阵,都可以转化为Jordan标准型。因为这些标准型具备与原矩阵相同的很多特性,而由于标准型的形式比较特殊,其特性更易于研究,并且由于标准型的形式是固定的,对其各种特性的研究有固定的套路可循。

编辑于 2012-09-27

​赞同 45​​3 条评论

​分享

​收藏​感谢

Peter Yin

Peter Yin

码农万岁

8 人赞同了该回答

用一句话来回答吧,相似矩阵就是两个坐标系统对同一个线性关系的刻画,而其中的矩阵P就是两个坐标体系的变换矩阵

发布于 2017-05-26

​赞同 8​​1 条评论

​分享

​收藏​感谢

洪武ea

洪武ea

学有机的吃货

2 人赞同了该回答

群的两个矩阵表示同构,当且仅当对应的矩阵相似,当然,它们也都同构于某个线性表示

编辑于 2017-10-12

​赞同 2​​3 条评论

​分享

​收藏​感谢

Hu组织

Hu组织

理科宅

4 人赞同了该回答

矩阵相似意义如其他答案所说:若A表示某线性变换,B表示同一线性变换在另一组基下的表示,则A和B的关系就是A=M-1BM。M就是那组新基 BM表示B对基M做线性变换; M-1左乘一个向量表示将该向量换算成以M为基表现的形势

发布于 2017-03-16

​赞同 4​​1 条评论

​分享

​收藏​感谢

幻想曲

幻想曲

教师、科研人员

37 人赞同了该回答

要理解相似矩阵,首要要知道矩阵代表的是线性变换。虽然我们可以直接去研究矩阵的一些特性,但我们其实可以这样说:
矩阵就是线性变换! 矩阵就是线性变换! 矩阵就是线性变换!
(注:虽然咱们很多课本都是先介绍的矩阵再介绍的线性变换,但是很多经典的线性代数课本都是先介绍的线性变换,再引入的矩阵对其的描述,因为有了矩阵线性变换表示起来就方便了。)

而两个相似的矩阵的定义简单说就是:同一个线性变换的不同矩阵表示形式
可是为什么变换相同,而矩阵却不一样呢?原因就是线性空间中的一个很基本的概念—线性空间的基。注意同一个向量在不同的基下表示形式不一样,所以同一个线性变换在不同的基下矩阵的表示也就会不一样。用一个例子来表示吧。

例子:我们先找一个线性变换f(\left( \begin{array}{ccc}  x  \\  y  \end{array} \right) ) = \left( \begin{array}{ccc}  x + 2y \\  y  \end{array} \right)
比如f(\left( \begin{array}{ccc}  1  \\  1  \end{array} \right) ) = \left( \begin{array}{ccc}  3 \\  1  \end{array} \right)
下面我们给出描述这同一个线性变换的两个相似的矩阵。前面说了,我们同时也要给出两个不同的基:

第一个基:B=<\left( \begin{array}{ccc}  1  \\  0  \end{array} \right), \left( \begin{array}{ccc}  0  \\  1  \end{array} \right) >,相应的矩阵为:T1=\left( \begin{array}{cc}  1  & 2\\  0  & 1\end{array} \right)
用矩阵来计算线性变换分两步:
(1) 先将要变换的向量变成相应的基下的坐标形式,比如\left( \begin{array}{ccc}  1 \\  1  \end{array} \right)在基B(因为B是自然基)下的的坐标还是\left( \begin{array}{ccc}  1 \\  1  \end{array} \right),所以可以直接使用;
(2) 将要变换的向量左乘这个矩阵。
试一下:f(\left( \begin{array}{ccc}  1  \\  1  \end{array} \right) ) = \left( \begin{array}{ccc}  1 & 2 \\  0  & 1\end{array} \right) \left( \begin{array}{ccc}  1  \\  1  \end{array} \right) = \left( \begin{array}{ccc}  3  \\  1  \end{array} \right) 。

第二个基:D=<\left( \begin{array}{ccc}  0  \\  1  \end{array} \right), \left( \begin{array}{ccc}  1  \\  1  \end{array} \right) >,相应的矩阵为:T2=\left( \begin{array}{cc}  -1  & -2\\  2  & 3\end{array} \right)
至于T2是怎么求的,这里省略。
下面我们就来验证一下,T2描述的还是线性变换f。
首先我们还是来看向量\left( \begin{array}{ccc}  1 \\  1  \end{array} \right)在基D下的坐标,通过计算得到\left( \begin{array}{ccc}  0 \\  1  \end{array} \right),然后我们左乘:f(\left( \begin{array}{ccc}  1  \\  1  \end{array} \right) ) = \left( \begin{array}{ccc}  -1 & -2 \\  2  & 3\end{array} \right) \left( \begin{array}{ccc}  0  \\  1  \end{array} \right) = \left( \begin{array}{ccc}  -2  \\  3  \end{array} \right)
为什么结果不对? 原因就是\left( \begin{array}{ccc}  -2  \\  3  \end{array} \right)还是在D下的坐标,我们在把它转变为自然基下的表示形式,这里因为要验证,所以写一下步骤:
-2 \left( \begin{array}{ccc}  0  \\  1  \end{array} \right) + 3 \left( \begin{array}{ccc}  1  \\   1 \end{array} \right) = \left( \begin{array}{ccc}  3  \\  1  \end{array} \right)
这里我们完全是为了写的方便,所以才用一个具体的向量\left( \begin{array}{ccc}  1 \\  1  \end{array} \right),其实完全可以用符号比如x和y来验证一般的形式,从而确定两个矩阵的确表示的是同一个线性变换。

这样我们就验证了:T1和T2是相似的,表示的都是f这个线性变换。

 

既然那么多矩阵表示的都是同一个线性变换,为什么要找那么多呢?原因就是有些矩阵的形式比较简单,观察或者计算比较方便。所以也就会引出特征值、对角化等的概念了,这里就不说了。

.

编辑于 2016-08-08

​赞同 37​​1 条评论

​分享

​收藏​感谢收起​知乎用户

知乎用户

2 人赞同了该回答


考研做的笔记。简单来说就是,n维向量空间有一组基P(不一定是正交的)某在绝对坐标系下表示的向量Y在P下的坐标是X,则Y经过某线性变换A变换后的新向量AY在P下的新坐标X¹=BX,其中B是A的相似矩阵,B=P-1AP。(慢慢地我已经把线性变换的概念融入到线性代数的理解中了如果有人看不懂也没关系我是自娱自乐)

发布于 2017-10-12

​赞同 2​​4 条评论

​分享

​收藏​感谢收起​知乎用户

知乎用户

2 人赞同了该回答

相似矩阵描述的是同一个变换过程。只是用于描述这一过程的基向量不一样。

P和P逆的作用就是先转换基向量(P),转换基向量后就可以在这一组基向量基础上进行矩阵变换,然后P逆把变换后的那一坨东东的基向量再转回来。

理解成有个中国人去国外问路,不懂英文只能去用翻译软件。翻译软件先把中文翻译成英文,然后老外看懂英文后用英文回答问题,然后翻译软件再把英文问题转换成中文答案。“老外看翻译的英文后用英文回答问题”与“有个当地华人直接用中文回答中文问题”就是一对儿相似矩阵。其对应的变换都是“问题—答案”这一个映射。

为啥要相似矩阵,举个例子,学数学、计算机的都能知道,相比翻译版,还是原版的书比较清晰易懂。换言之,如果我有一本翻译过来的书,里面有些东西由于翻译原因看不懂,不方便进行从问题到答案的映射(一个矩阵由于某些性质不太好处理),那我最好能找到一本原版书来看(找一个好处理的相似矩阵)。

某些相似矩阵有一些我们需要的优势,例如计算方便(例如特征向量组成的矩阵),那就最好转换过去。

发布于 2017-06-23

​赞同 2​​添加评论

​分享

​收藏​感谢

幺禾

幺禾

2 人赞同了该回答

简单来说,两个矩阵相似,那么,他们具有相同的性质。
那这条性质的用法就是。当你想知道一个矩阵有什么性质但因为它太复杂了看不出来时候。这时候,你正好知道,它跟另一个矩阵相似,而那个矩阵的特性一眼就看出来了。那么,本来这个很复杂的矩阵的性质跟那个矩阵是一样的。
就是这样用的。

----------------------------------------------------
补充一点吧,前面很多答主都再说变换到对角阵啊,Jordan形式,上三角形式啊之类的。这些都是操作上的东西了。
其实核心在于相似两个字。用法跟相似三角形也差不太多。给你了你个你不知道的三角形。你想知道它的角度,性质啥的。抓瞎了。
这时候了我告诉你,它跟一个你知道的三角形相似。好了,那你就知道那个三角形的性质了。

编辑于 2017-06-11

​赞同 2​​添加评论

​分享

​收藏​感谢

何大壮

何大壮

工人

1 人赞同了该回答

好的解释,是几乎能让一个九岁的孩子都明白的解释。

恕我直言,关于这个问题,相似矩阵---这样的解释我还没见到过。

我也不知道怎么解释这个问题,正在思考。

编辑于 2018-02-13

​赞同 1​​添加评论

​分享

​收藏​感谢匿名用户

匿名用户

1 人赞同了该回答

刚刚就用相似矩阵推导出了不同基底下的某系统哈密顿量。

还有题主的买菜问题很奇怪,既然菜价和油价成正比,拟合出正比的系数就可以了,和线性代数有什么关系?

发布于 2017-05-27

​赞同 1​​添加评论

​分享

​收藏​感谢

Yaque

Yaque

IT小朋友一枚

可能我没看完,但我看的答案里面没有我要说的,
矩阵相似性用处很大,你要知道在计算机中,也就是电脑手机登中几乎所有的数据都能用矩阵表示,而两张图片一样吗,就是两个矩阵一样吗,两个矩阵相似吗。

编辑于 2018-03-12

​赞同​​添加评论

​分享

​收藏​感谢

李中华

李中华

工程 哈工大 万科 融创 设计 地铁

实话说 马哥回答的真好,很少有人这么认真的回答问题,先给马哥点赞。
通读完成后我的理解是这样的,看看能不能帮助你:


我的理解这只是个过程变换,通过两次坐标的变化,对比两个坐标系下的同一矩阵。举例子:A坐标系,B坐标系,空间点M。核心是A、B坐标系下M点的坐标Ma、Mb是相似的。

那么相似矩阵的定义是咋来的呢?A坐标系转换成B坐标系通过矩阵P,相反B坐标系转换成A坐标系就是p-1。

所以:

(个人理解不是很严密,只能是感觉上的理解,对于这个回答有一个瑕疵就是在三维坐标系下,只需要转化一次坐标系就够了,而这里来回了两次。)

编辑于 2018-01-20

​赞同​​添加评论

​分享

​收藏​感谢

刘静

刘静

理工科女博士

相似矩阵是用来简化矩阵的,通过坐标变换。

发布于 2017-09-14

​赞同​​添加评论

​分享

​收藏​感谢

zzy

zzy

程序员

建议楼主先去看看坐标变换公式,这个是相似矩阵的基础,它描述的是在不同的基中同一个向量(此处去掉脑海中的网格线)的坐标表示如何切换。相似矩阵多用于特征值分解和奇异值分解中,而它们最常见的就是用于PCA降维。因为对矩阵特征值分解后就能得到矩阵的主要运动方向和运动幅度,这些对于降维和去噪都是很必要的

发布于 2017-08-10

​赞同​​添加评论

​分享

​收藏​感谢

刘智

刘智

简单说就是描述一个运动的同一个线性变换在不同坐标系下的表达。有意思的是如果描述同一个空间在不同坐标系的位置只要用变换矩阵的逆矩阵左乘位置向量就可以,而描述运动还需要再右乘一次变换矩阵。

编辑于 2017-08-09

​赞同​​添加评论

​分享

​收藏​感谢

Aurelius

Aurelius

通过比较你挑菜的时间和价格,可以算出你的工资水平。
通过比较大多数人挑菜的时间和价格,可以算出一地、一国的最低工资水平。

发布于 2017-07-03

​赞同​​添加评论

​分享

​收藏​感谢知乎用户

知乎用户

怎么没有看到数学大佬的回答…

编辑于 2017-05-27

​赞同​​添加评论

​分享

​收藏​感谢匿名用户

匿名用户

我也像你这样理解数学,后来我的DE就挂了。
大概只能转行做销售了

发布于 2017-05-27

​赞同​​添加评论

​分享

​收藏​感谢知乎用户

知乎用户

就是可以换个视角看问题

发布于 2017-05-26

​赞同​​添加评论

​分享

​收藏​感谢匿名用户

匿名用户

主成分分析里要用到矩阵相似的数学概念。正交对角化用来提取主成分,相似变换也可以把主成分尽可能分开。(有时候是做正交旋转,只是resemble的一个小技巧吧)

提取主成分以后可以做聚类分析,因子分析,回归分析之类的。

发布于 2017-05-26

​赞同​​添加评论

​分享

​收藏​感谢

蛏子

蛏子

天使

假设小明的工作中要用到个很复杂的算钱公式,但是只能计算人民币,突然有天老板让他计算美元,咋整?当然是先把美元换算成人民币,算出多少钱,再换算成美元咯。

整个过程就是(汇率的逆×公式×汇率)×输入值。美元和人民币就是两个不同的基,汇率就是两个基之间的过渡矩阵,公式就是线性变换。

发布于 2018-06-08

​赞同​​添加评论

​分享

​收藏​感谢

天才李健

天才李健

勇往直前的计算机

感觉楼主真正想问的是矩阵到底有有什么作用。。。。。

我的看法是。一个矩阵,就完整表示了一个世界。以前我都是直觉的认为 (x1;y1;z1;t1) 代表了一个世界,其实这是不对的。真的代表世界的是 (x1;y1;z1;t1,x2;y2;z2;t2,x3;y3;z3;t3,x4;y4;z4;t4)

发布于 2018-05-18

​赞同​​添加评论

​分享

​收藏​感谢

迪奥斯

迪奥斯

律师

就是你娶媳妇的时候不知道该给多少彩礼,听说邻家小妹出嫁收了婆家八万八,然后你决定给九万八。嗯,差不多就酱紫。

发布于 2017-05-27

​赞同​​添加评论

​分享

​收藏​感谢

WHY君

WHY君

言情小说迷 大学生

刚考完线性代数的我觉得其实还好啦。考试前我差不多也是这个想法,感觉要被逼疯了。认真刷了10套题,以不算太低的成绩通过考试,就觉得其实可以接受。

  • 22
    点赞
  • 62
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值