1、主成分估计(偏向于概率):
设有p个回归自变量,第i次试验测得的实验值,并将他们标准化消除量纲影响,记为(共n次实验)
标准化方法(方法很多,基本上机器学习里的一些归一化都可用于标准化)
这样就形成了n*p矩阵X
可构造回归模型
β为p1的向量,ε为n1的误差向量,β0为常量,1为n1的列向量
经过主成分转换后
Z=Xη,η为X’*X的特征向量,也是主成分的方向(本文开头链接中有详细证明),将X沿η的方向进行分解,即可得到型的主成分方向的实验值,则回归模型可转换为
Q为p个主成分方向所形成的矩阵
下面只需找出β很小的分量,然后将该分量的主成分删除即可,判断方法