1. Concept
PCA是一个降维的算法,通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。
降维完成之后,PCA找到的每个新特征向量就叫做“主成分”,而被丢弃的特征向量被认为信息量很少,这些信息很可能就是噪音。
2. 主成分的个数(K的值)
PCA就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据
3. scikit-learn APIs
后面再更新
PCA是一个降维的算法,通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。
降维完成之后,PCA找到的每个新特征向量就叫做“主成分”,而被丢弃的特征向量被认为信息量很少,这些信息很可能就是噪音。
PCA就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据
后面再更新