这是《机器学习中的数学基础》系列的第6篇。
今天我们来介绍基变换,简单地说,基变换就是把向量用不同的基来表示。我们来举个例子:
如上图,在我们常见的标准坐标系中,有一个向量w=(2,2)。此时的基向量是i、j,我们可以用2i+2j来表示向量w。那能不能更换基向量来表示w呢?可以的,如下图:
向量w并没有变化,我们只是把原来的基向量都扩大了1倍,变成了新的基向量i’和j’。那w如何用新的基向量来表示呢?从图上就可以看出,w=i’+j’。由于基变换了,我们的坐标系自然也跟着变换了。因此,在新的坐标系中,向量w就表示为(1,1)。
好,现在让我们聚焦于图2中新的坐标系。其中,向量w=(1,1),我们想知道在标准坐标系中的向量w该如何表示呢(忘掉图1)?
在新坐标系中,w=1i’+1j’(1),而i’在标准坐标系中的坐标是(2,0),j’在标准坐标系中的坐标是(0,2),把它们代入到(1)式,可得:
这是啥?这不就是矩阵乘以向量的展开吗?如下:
因此,我们就求得了w在标准坐标系中的坐标是(2,2)。
我们再来看下上面的式子,矩阵[2,0;0,2]表示了一种线性变换,它把新坐标系中的向量表示为了标准坐标系中的向量。那肯定又有人问了,如果给定一个标准坐标系的向量,如何求出它在新坐标系中的向量坐标呢?聪明的你肯定想到了,矩阵[2,0;0,2]的逆就表示了从标准坐标系到新坐标系的转换。因此,只需用矩阵[2,0;0,2]的逆乘以标准坐标系中的向量,就可以得到新坐标系中的向量表示了。
这就是今天的全部内容,你都get到了吗?