主成分分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。注意:只有在指标个数特别多,且指标之间存在很强的相关性时,才能用主成分分析。(否则做出来效果不好)
🔴主成分的特点:
🔷 主成分个数远远少于原有变量的个数
🔷 主成分能够反映原有变量的绝大部分信息:因子并不是原有变量的简单取舍,而是原有变量重组后的结果。
🔷 主成分之间应该互不相关:通过主成分分析得出的新综合指标(主成分)之间互不相关,由此解决多重共线性的问题。
🔷 主成分具有命名解释性
🔴主成分分析法的主要任务有两点:
(1)确定各主成分Fi关于原变量Xj的表达式,即系数aij。
每一个主成分所提取的信息量可用其方差来度量。例如,方差Var(F1)越大,表示F1包含的信息越多。常常希望第一主成分F1所含的信息量最大。因此,在所有的线性组合中选取的F1应该是X1, X2, …, Xp所有线性组合中方差最大的,故称F1为第一主成分。
(2)计算主成分载荷。主成分载荷是反映主成分Fi与原变量Xj之间的相互关联程度: