Matlab 模糊C均值聚类分析与因子分析实验报告
提示:数据资源在本CSDN号的上传资料中直接领取
1 引言
数据:gyzb.mat(按顺序对应每一列)为:31个省市区的国有控股企业的主要指标(包括:总利润(亿元)、总资产贡献率(%)、资产负债率(%)、流动资产周转次数(次/年)、工业成本费用利用率(%)和人均主营收入(万元/人))。需要使用数据分析方法对该数据进行分析,试着得到一些结论。这里使用的分析方法为:模糊C均值聚类分析、因子分析。
2 算法原理
2.1 模糊C均值聚类分析的简介及算法原理:
(1)简介:
模糊C均值聚类分析(FCM,Fuzzy c-means)是从C从均值算法(Hard c-means)发展而来的。模糊聚类分析是根据研究对象本身的属性来构造模糊矩阵,并在此基础上根据隶属度来确定聚类关系,即确定样本之间的模糊关系定量。
(2)算法原理:
(3)算法步骤:
【1】设置好聚类类别数,设定迭代收敛条件,初始化各个聚类中心;
【2】用当前的聚类中心,计算隶属度值度函数。
【3】使用隶属度函数,重新计算计算各个聚类的中心。
【4】重复【2】、【3】的运算,直到各个样本的隶属度稳定;
【5】当算法收敛时,就得到了各类的聚类中心和各样本对于各类的隶属度值,从而完成了模糊聚类划分。
2.2 因子分析的简介及算法原理:
(1)简介:
因子分析(factor analysis)是通过研究多个变量间相关矩阵(或协方差矩阵)的内部依赖关系,找出能综合所有变量主要信息的少数几个随机变量的一种统计分析方法、预处理方法、降维技术。这几个随机变量不能直接测量,通常称为因子。各个因子间互不相关,所有变量都可以表示成公因子的线性组合。因子分析的目的就是减少变量的数目,用少量因子(若干更基本的有代表的变量)代替所有变量去分析整个问题;这些更基本的变量也叫做公共因子或共性因子。
(2)算法原理:
设有n个样本,p个指标,X = (X1, X2, X3, ……,XP)T为随机向量,要寻找的公因子为F = (F1,F2,……,Fm)T,则模型
X1 = a11F1 + a12F2 + …… + a1mFm