前言
自然正交分解(EOF),主成分分析(PCA)原来是一种方法,或者说是比较相似的方法。因为专业的原因,气象上用到EOF的时候比较多,而大学期间参加数模又接触到了主成分分析,可是那是的我从来没想到这是一种方法,哎,看算法原理没有看仔细。直到后来参加研究生赛的时候,学姐告诉我真相,这原来是一种方法啊。最近气象统计也主要讲这块,所以我就亲自实践了一下来惩罚我的不认真。
EOF&PCA 前提准备
X是经过减去时间距平处理后的数据,即
X是由m个格点的场形成t个时刻的时间序列
X可以被m个两两正交(模为特征值)的时间序列和m个两两正交的单位空间序列完全表达。此时为0
其中 (1)
这里的V相当于坐标旋转系数,比如,对于一个二维空间,原来的基坐标是i=[1,0]和j=[0,1].有一个场向量是v=5i+6j, 下一时刻变为v2=7i+3j, 那么x可以表示为,V就是EOF里面的模态,也是PCA中的载荷向量或者通俗的叫法是各个原成分分量的权值,对于v1=[3/sqrt(14),2/sqrt(14)]来说,基向量就变成了一个k=3/sqrt(14)i+2/sqrt(14)j, 他对应的时间系数变为=[27/sqrt(14),27/sqrt(14)],在PCA中是X的一个主成分,也是EOF的时间系数。
还有一点我觉得比较重要的是时间系数和各个模态分量的性质:
空间场:正交,单位向量(模为1); (2)
时间上,正交,模为特征值,(如果除以总特征值的和,代表的是对于原场时间序列解释的方差贡献率)。 (3)