计算皮尔逊相关系数——corr
%% 多变量间相关性分析和选取相关性强的变量方法属于“属性约减”范畴。
%即进行各变量间的相关性分析,选取相关性强的变量。
%可以使用皮尔逊Pearson相关性系数r进行衡量,如果其绝对值越接近1,则变量X,Y的相关性越强。
%对相关性系数进行排序,保留相关性强的变量,剔除相关性差的变量。
% 一般来说,取绝对值后,0-0.09为没有相关性,0.3-弱,0.1-0.3为弱相关,0.3-0.5为中等相关,0.5-1.0为强相关。
%但是,往往你还需要做显著性差异检验,即t-test,来检验两组数据是否显著相关,这在SPSS里面会自动计算的
%%
ys_data=xlsread('季度数据.xlsx'); %读入原始数据,第一列放因变量
[n,p]=size(ys_data); % n行,p列
n=18;p=20;%直接指定
for i=2:p
Y=ys_data(:,1); % 将因变量赋值给Y
X=ys_data(:,i); % 逐个将自变量赋值给X
xs(1,i-1)=i; % 将相关性系数数组的第一行添加变量所在列位置标记1:p
xs(2,i-1)=corr(X,Y,'type','Pearson'); %逐个计算自变量与因变量间的Pearson相关性,保存至xs数组第二行
end
xyb=[ys_data;[1 xs(2,:)]];
xlswrite('季度数据pearson.xlsx',xyb);