一、解决的问题
数据处理过程中多维数据的降维问题。多个变量之间存在相关关系,在分析过程中会耗费资源
二、思路
利用变量之间的线形组合,将要处理的数据利用初始数据变量的线性组合减少数据的维数,最后选取主成分方差累计贡献率大于80%的主成分作为处理变量即可。
三、代码
data:需要降维的数据
newData=princomp(data,cor=T#使用相关系数法进行主成分分析))
summary(newData)
newData$sdev¥标准差
newData$loadings#主成分负荷矩阵
newData$scores #主成分矩阵,新变量数据