PCA用于无监督数据的数据降维:它的思想是将高维数据用低维数据表示,并且尽可能的保留原始数据的最大的信息。
作用:能够用于很多个特征的自动筛选。
由于信息的损失,在一定程度上相当于对数据加了正则化。
特征选择:1.人工筛选(专家筛选)。2.将所有数据都用上,使用PCA降维技术实现数据特征的自动筛选。
比如上图中的PCA降维的思想是:在二维坐标系下,使投影在蓝色线上点的分布尽可能离散(也就使方差尽可能的大)
PCA用于无监督数据的数据降维:它的思想是将高维数据用低维数据表示,并且尽可能的保留原始数据的最大的信息。
作用:能够用于很多个特征的自动筛选。
由于信息的损失,在一定程度上相当于对数据加了正则化。
特征选择:1.人工筛选(专家筛选)。2.将所有数据都用上,使用PCA降维技术实现数据特征的自动筛选。
比如上图中的PCA降维的思想是:在二维坐标系下,使投影在蓝色线上点的分布尽可能离散(也就使方差尽可能的大)