本文是https://zhuanlan.zhihu.com/p/30191876的总结与补充
标量、向量、矩阵与张量:
矩阵向量的运算
1,矩阵乘法1 2 3
4 5 6
6 5 4
3 2 1
18 20 18
1 2 3
4 5 6
ans =
1 4
2 5
3 6
单位矩阵和逆矩阵
1,单位矩阵行列式
方差,标准差,协方差
范数
范数如下:
所以
范数:为x向量各个元素绝对值之和;
范数:为x向量各个元素平方和的开方,即距离公式,L2范数被称为欧几里得范数,简称欧氏距离
特殊类型的矩阵和向量
只在主对角线上含有非零元素,其他位置都是零
单位矩阵 是对角元素全部是 1的对角矩阵。 = 1的向量称为单位向量
3,对称矩阵:
转置和自己相等的矩阵:
4,向量正交:
两个向量的内积为0,物理意义:垂直
5,正交向量组:
由n个互相正交的向量构成的向量组
6,标准正交向量组:
组内的向量不仅互相正交,而且都是单位向量,标准正交向量组也被称为标准正交基
7,正交矩阵:
具有的方阵称为正交矩阵 ,所以,
正交矩阵的特点:
(1)求逆代价小
(2)正交矩阵的行或列向量组是标准正交向量组
8,可对角化矩阵:
如果存在一个可逆矩阵 P 使得 P −1AP 是对角矩阵,则A就被称为可对角化的
9,阶梯型矩阵
矩阵为阶梯型矩阵则矩阵中每一行的第一个不为零的元素的左边及其所在列以下全为零
线性相关:
矩阵的秩:
用初等行变换化成阶梯型矩阵,梯矩阵中非零行数就是矩阵的秩。
维数:
矩阵可看成是一个向量组,向量组中线性无关的向量的个数就是矩阵的维数,二维矩阵有行维和列维
方向向量及向量的长度
直线可由向量表示,所以直线的方向向量即为向量的方向向量
方向向量的定义为与直线平行的任一向量
向量的长度即向量的L2范数
只改变向量长度不改变方向的方法:对向量每一个值乘以相同的正数
特征分解以及其意义
意义:分解矩阵来发现矩阵表示成数组元素时不明显的函数性质,特征分解将矩阵分解为一组特征值与特征向量性质:一个矩阵的特征向量经过特定变换后保持方向不变,只改变长度
特征向量的原始定义:
CX是方阵A对X向量变换后的结果,CX与X方向相同,X是特征向量,C即为特征值
注意:只有可对角化矩阵才可以作特征分解,可对角化矩阵的特征值与特征向量是已知的
求解:令 A 是一个 N×N 的方阵,且有 N 个线性无关的特征向量
这样, A 可以被分解
其中 Q 是N×N方阵,且其第 i列为 A 的特征向量 。 Λ 是对角矩阵,其对角线上的元素为对应的特征值,也即
几何意义:矩阵与某一个向量或某些向量相乘,这些向量只发生伸缩变换,不产生旋转,这些向量被称为特征向量,伸缩的比例称为特征值
为了减少处理数据量,采取降维的方法,删除对结果影响小的数据
做法:
求协方差矩阵,对协方差矩阵特征分解,进行对角化
R是原始数据集矩阵,U是特征向量组成的矩阵,D是特征值组成的对角矩阵,并按由大到小排列
R’ =RU,实现了数据集在特征向量这组正交基上的投影
R’中的数据列是按照对应特征值的大小排列的,后面的列对应小特征值,去掉以后对整个数据集的影响比较小
奇异值分解(SVD)及其意义
将矩阵 A 分解成三个矩阵的乘积:矩阵 U 和 V 都被定义为正交矩阵,U是变换后的正交矩阵,V是原始正交矩阵,矩阵 D 是由特征值构成的对角矩阵。注意:矩阵 D 不一定是方阵。
求解过程复杂,看这篇文章奇异值分解
奇异值分解的几何意义:
简介:矩阵是线性变换过程的表达形式,在一组正交基下的线性变换可被分解为在另一组正交基下的长度伸缩,所以原矩阵可被分解为由两组正交基与对角矩阵
看http://blog.csdn.net/redline2005/article/details/24100293
奇异值分解与特征值分解的联系:
1,奇异值可用于所有矩阵,特征值分解只能用于可对角化矩阵
2,协方差矩阵的奇异值分解与特征值分解的结果是一致的,所以,SVD是PCA的另一种实现方式
Moore-Penrose 伪逆
为得到矩阵A,采用公式:
矩阵U,D 和V 是矩阵A奇异值分解后得到的矩阵,D+是D的违逆,违逆运算为:非零元素求倒,再转置
迹运算
迹运算是求矩阵对角元素的和,符号Tr(A)重要性质:
Tr(ABC) = Tr(CAB) = Tr(BCA).