PCA
小麦粒
我的人生,我做主
展开
-
PCA - python实现(二)
1. 数据压缩,数据压缩或者数据降维首先能够减少内存或者硬盘的使用, 如果内存不足或者计算的时候出现内存溢出等问题, 就需要使用PCA获取低维度的样本特征。其次, 数据降维能够加快机器学习的速度。 2. 数据可视化,在很多情况下, 可能我们需要查看样本特征, 但是高维度的特征根本无法观察 3.其中s是对矩阵a的奇异值分解。s除了对角元素不为0,其他元素都为0,并且对角元素从大到小排列。s中有n个奇异值,一般排在后面的比较接近0,所以仅保留比较大的r个奇异值。原创 2019-07-29 22:20:16 · 1783 阅读 · 1 评论 -
PCA(一)
1)将原始数据按列组成n行m列矩阵X 2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值 3)求出协方差矩阵 4)求出协方差矩阵的特征值及对应的特征向量 5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P 6)Y=PX即为降维到k维后的数据原创 2019-07-26 11:19:27 · 2052 阅读 · 0 评论