原因:
数据压缩
可视化数据
注意:降维后的特征可能不具有物理意义,或者偏向于之前的某几个特征
常用算法:PCA(主成分分析)
每个点到直线投影的距离很短,也即投影误差最小。
在做PCA之前,我们需要对数据进行均值归一化和特征规范化
降维过程:证明很复杂就是了
使用PCA可以提高学习算法的速度,但是不能用来防止过拟合
注意降维前和还原后的数值还是有差别的,但是服从的分布确实相似的
原因:
数据压缩
可视化数据
注意:降维后的特征可能不具有物理意义,或者偏向于之前的某几个特征
常用算法:PCA(主成分分析)
每个点到直线投影的距离很短,也即投影误差最小。
在做PCA之前,我们需要对数据进行均值归一化和特征规范化
降维过程:证明很复杂就是了
使用PCA可以提高学习算法的速度,但是不能用来防止过拟合
注意降维前和还原后的数值还是有差别的,但是服从的分布确实相似的