简介
在医学统计中,尤其是在临床实验中,每个观测对象记录的观测结果包含多个反应变量(Respone Variables)。例如,血记录有收缩压、舒张压、脉压等,这种有多个变量的数据称为多变量数据。主成分分析是多变量分析方法中的一种分析方法,常见的多变量分析方法还包括多变量方差分析(Multivariate analysis of variance,MANOVA)、因子分析(Factor analysis)、典型相关(Canonical correlation analysis)、以及聚类分析(Cluster analysis)等。主成分分析(Principal Component Analysis,PCA)是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。
主成分分析
主成分分析(Principal Component Analysis,PCA)通过将原始变量转换为原始变量的线性组合(主成分),在保留主要信息的基础上,达到简化和降维的目的。主成分与原始变量之间的关系主要有:
- 主成分是原始变量的线性组合。
- 主成分的数量相对于原始数量更少。
- 主成分保留了原始变量的大部分信息。
- 主成分之间相互独立。
主成分分析的优点
- 不要求数据呈正态分布,主成分就是按数据离散程度最大的方向对基组进行旋转,这个特性扩展了其应用范围。
- 通过对原始变量进行