本篇的思维导图:
数据降维:主成分分析PCA
建立模型分析特征数据时,很可能会面临特征数据维度过大的问题。例如,根据已有的信用卡持有人信息及其违约数据来建立信用卡违约预测模型时,数据可能包含申请人的收入、年龄、性别、婚姻状况、工作单位等数百个维度的特征。如果将所有特征数据都用来拟合模型,会提高模型的复杂度,造成过拟合风险显著增大,且不同的特征数据间可能存在共线性。此时就需要对数据进行降维,以浓缩特征向量。
数据降维中常用的算法是主成分分析法PCA。
数据降维
【阶段三】Python机器学习27篇:机器学习项目实战:数据降维:主成分分析PCA、基本原理与PCA模型:人脸识别
本文介绍了主成分分析PCA在数据降维中的应用,特别是用于人脸识别项目。PCA通过线性变换降低高维数据的复杂度,去除噪声并发现模式。在人脸识别项目中,PCA用于处理大量像素特征,实现数据预处理、特征工程、模型构建和评估。
摘要由CSDN通过智能技术生成