这篇文章不错,Mark下
前言
奇异值分解(SVD)在降维,数据压缩,推荐系统等有广泛的应用,任何矩阵都可以进行奇异值分解,本文通过正交变换不改变基向量间的夹角循序渐进的推导SVD算法,以及用协方差含义去理解行降维和列降维,最后介绍了SVD的数据压缩原理 。
目录
1. 正交变换
2. 特征值分解含义
3. 奇异值分解
4. 奇异值分解例子
5. 行降维和列降维
6. 数据压缩
7. SVD总结
1. 正交变换
正交变换公式:
上式表示:X是Y的正交变换 ,其中U是正交矩阵,X和Y为列向量 。
下面用一个例子说明正交变换的含义:
假设有两个单位列向量a和b,两向量的夹角为θ,如下图:
现对向量a,b进行正交变换:
正交变换的两个重要性质:
1)正交变换不改变向量的模。
2)正交变换不改变向量的夹角。
上图可以得到重要结论:基向量正交变换后的结果仍是基向量 。基向量是表示向量最简洁的方法,向量在基向量的投影就是所在基向量的坐标,我们通过这种思想去理解特征值分解和推导SVD分解。
2. 特征值分解的含义
用图形表示为:
由上图可知,矩阵A没有旋转特征向量,它只是对特征向量进行了拉伸或缩短(取决于特征值的大小),因此,对称矩阵对其特征向量(基向量)的变换仍然是基向量(单位化) 。
特征向量和特征值的几何意义:若向量经过矩阵变换后保持方向不变,只是进行长度上的伸缩,那么该向量是矩阵的特征向量,伸缩倍数是特征值。
3. SVD分解推导
我们考虑了当基向量是对称矩阵的特征向量时,矩阵变换后仍是基向量,但是,我们在实际项目中遇到的大都是行和列不相等的矩阵,如统计每个学生的科目乘积,行数为学生个数,列数为科目数,这种形成的矩阵很难是方阵,因此SVD分解是更普遍的矩阵分解方法 。
先回顾一下正交变换的思想:基向量正交变换后的结果仍是基向量 。
我们用正交变换的思想来推导SVD分解:
假设A是M*N的矩阵,秩为K,Rank(A)=k。
正交向量的模:
用矩阵的形式表示(3.3)式:
(3.5)式写成向量形式:
则:
A = XY
因为X和Y分别是列满秩和行满秩,所以上式是A的满秩分解。
3. 奇异值分解的例子
本节用一个简单的例子来说明矩阵是如何进行奇异值分解的。矩阵A定义为:
4. 行降维和列降维
本节通过协方差的角度去理解行降维和列降维,首先探讨下协方差的含义:
单个变量用方差描述,无偏方差公式:
由上式可知,协方差是描述变量间的相关关系程度:
1)协方差cov(x,y) > 0时,变量x与y正相关;
2)协方差cov(x,y)<0时,变量x与y负相关;
3)协方差cov(x,y)=0时,变量x与y不相关;
变量与协方差关系的定性分析图:
数据集A在特征空间展开为:
5. 数据压缩
本节介绍两种数据压缩方法:满秩分解和近似分解
矩阵A的秩为k,A的满秩分解:
我们用灰色部分的三个小矩阵近似表示矩阵A,存储空间大大的降低了。
6. SVD总结
任何矩阵都能进行SVD分解,SVD可以用于行降维和列降维,SVD在数据压缩、推荐系统和语义分析有广泛的应用,SVD与PCA的缺点一样,分解出的矩阵解释性不强 。
参考:
https://blog.csdn.net/zhongkejingwang/article/details/43053513
https://www.cnblogs.com/pinard/p/6251584.html