为什么进行特征选择? 冗余:部分特征的相关度较高,容易消耗计算性能。噪声:部分特征对预测结果有影响。 特征选择是什么 特征选择API sklearn.feature_selection.VarianceThold 主成分分析PCA PCA是什么? 本质:PCA是一种分析、简化数据集的技术。 目的:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。 作用可以消减回归分析或者聚类分析中特征的数量。 PCA降维分析可以参考以下文章: PCA降维实例分析 数据降维