[toc]
介绍
本篇分别有主成分分析,层次分析,聚类分析,因子分析的简单介绍以及在MATLAB(2018a)上使用的简单介绍 ( 附源码 )
主成分分析
主成分分析-百度百科
简单讲:主成分分析就是取出几个较少的变量尽可能多地反映原来变量的信息
(只看主要对结果有影的几个变量)
主成分分析适用于数学建模中筛选出少量变量对结果造成主要影响并用函数关系表征的情况
%% 主成分分析 (降维)
clc, clear
load example_1.txt %数据导入(数据要求:前几列为自变量,最后一列为因变量)
data = example_1;
[m, n] = size(data);
num = 3; % 选取的主成分的个数
mu = mean(data);
sigma = std(data); %标准差
%z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况
%标准化的新数据=(原数据-均值)/标准差
std_data = zscore(data);
b = std_data(: , 1:end-1); % 四个变量x1, x2, x3, x4
r = cov(b); % 变量的协方差矩阵
% 运用协方差矩阵进行PCA
[PC, latent, explained] = pcacov(r); %返回主成分(PC)、协方差矩阵X的特征值 (latent)和每个特征向量表征在观测量总方差中所占的百分数(explained)
% 新的主成分z1 = PC(1,1)*x1 + PC(2,1)*x2 +