本人目前数学建模,机器学习微白一枚,
之前在知乎写了一点点文章,
当做记录,
之后听朋友说,写博客才是正儿八经记录,
所以,今天开始,一点pca降维
主成分分析,
不同指标对一个评价对象的贡献率是不同的,降维,就是,找到那些贡献率非常高的。
一,步骤
1 无量纲化处理
标准化
2协方差或相关系数矩阵处理。
3贡献率85%以上就OK
4求出相关系数矩阵的特征值,并和特征向量正交化
5重新组成新的评价指标。
6新的指标是由原来指标组成的,加上一些系数,也就是原来的矩阵进行一些线性变换
7新的指标主成分,要结合系数和正负性,再加上原来的指标含义进行分析出新的指标的含义
说白了,新的指标就是原来的指标线性组合,含义有的时候好分析,有的时候不好分析。
二,用途
1数据维度很多时,为了减少运算量,降维
2评价,针对一些指标搞个排名,可以直接降到一维(假如这个维度贡献率足够大)
直接就可以当一个总得排名指标了。
3