matlab_EDA
EDA 探索性数据分析 Explorative Data Analysis
BPM 二元邻接矩阵 bigram proximity matrix
数据球面化
mvnrnd
Multivariate normal random numbers
多元正态随机变量
clc,clear;
close all;
n=100;
mu=[-2,2];
sigma=[1,.5;.5,1];
X=mvnrnd(mu,sigma,n);
plot(X(:,1),X(:,2),'.')
result
上图显示了二维多元正态随机变量的散点图(这些点并未以原点为中心,且点云也不是球形的)
clc,clear;
close all;
n=100;
mu=[-2,2];
sigma=[1,.5;.5,1];
X=mvnrnd(mu,sigma,n);
%
%对数据进行球面化处理
xbar=mean(X);
%计算协方差矩阵的特征向量和特征值
[V,D]=eig(cov(X));
%数据中心化
Xc=X-ones(n,1)*xbar;
%球面化数据
Z=((D)^(-1/2)*V'*Xc')';
plot(Z(:,1),Z(:,2),'.')
result
散点以原点为中心成球形分布(这点类似于一维数据的z分数标准化)