在人工提取特征的时代,提取的特征往往具有较强的相关性,这会导致数据冗余,计算特征的相关性,为后续特征选择等提供参考依据。计算两个向量X、Y的相关性,公式如下:
MATLAB程序如下:
[m,n]=size(feature);
correlation_matrix=zeros(n,n);
for i=1:n
for j=1:n
X_Vector=feature(:,i);
Y_Vector=feature(:,j);
X_mean=mean(X_Vector);
Y_mean=mean(Y_Vector);
X_std=std(X_Vector);
Y_std=std(Y_Vector);
correlation_matrix(i,j)=mean((X_Vector-X_mean).*(Y_Vector-Y_mean))/(X_std*Y_std);
end
end
figure;
bar3(correlation_matrix);