PCA的主要适用场景:
(1)非监督式的数据集
它是一种非监督式的降维方法,因此适用于不带有标签的数据集,对于带有标签的可以采用LDA
(2)根据方差自主控制特征数量
最大的主成分的数量会小于或等于特征的数量,即,PCA可以输出全部的特征,具体取决于选择特征中解释的方差比例
(3)更少的正则化处理
选择较多的主成分将导致更少的平滑,因为能保留很多特征,减少正则化
(4)数据量较大的数据集
数据量大指数据记录多和维度多两种情况,PCA对大型数据集的处理效率高
(5)数据分布是位于相同平面上,数据中存在线性结构