cancorr
#典型相关分析是研究两组组变量之间的相关关系的技术,对于分析中的每个组变量要使其具备相应的意义,比如例子中
生理指标(体重/腰围/脉搏)训练指标(俯卧撑/仰卧起坐/跳绳)
将体重、腰围、脉搏组合在一起形成生理指标,俯卧撑、仰卧起坐、跳绳组合在一起形成训练指标,再又这两组变量进行典型相关分析,可以得到组变量之间的典型相关系数。
*计算角度:
x=(a1,a2,a3) y=(b1,b2,b3)
构造线性组合
x_l=n1a1+n2a2+n3a3实则N.dot(x_l)
y_l=m1b1+m2b2+m3b3实则M.dot(y_l)
N=(n1,n2,n3).T
M=(m1,m2,m3).T
p(x_l,y_l)=cov(x_l,y_l)带入x_l,y_l变成M和N的方差,证明是个凸函数然后用拉格朗日算法求极大值。
e.g.生理指标和健康指标的典型相关分析
#SAS代码解释和结果解释
proc import
file='D:\training material\典型相关分析.xlsx'
out=can_r
dbms=xlsx
replace;
run;
data can_r;
set can_r;
rename var1=weight var2=waist var3=pulse var4=chins var5=situps var6=jumps;
proc cancorr all data=can_r
vprefix=phys
vname='physilogical'#v前缀#vname
wprefix=exes
wname='exercises';
var weight waist pulse;
with chins situps jumps;
run;
简单统计结果省略;
给出三对典型变量组的线性组合的原始系数#还有标准化的系数,不展示了
典型相关#典型变量组间的典型相关系数,特征值#实则R2
一些检验典型相关系数的统计量
这里展示的是不同分类维度下的典型变量组合的复相关分析和交叉的相关分析;
冗余分析,用于典型变量分析中的技术,实则拿组合好的典型变量与原始变量做回归看R2;