Matlab 模糊C均值聚类分析与因子分析实验报告

xu_yushu

已于 2022-05-05 23:24:38 修改

阅读量2.1k

点赞数

分类专栏：实验报告数据分析文章标签：聚类数据分析 matlab

于 2022-05-05 12:29:44 首次发布

本文链接：https://blog.csdn.net/xu_yushu/article/details/124586171

版权

本文是关于Matlab中模糊C均值聚类分析与因子分析的实验报告。通过对31个省市区国有控股企业数据的应用，探讨了模糊聚类分析的迭代过程、结果稳定性以及因子分析的降维效果。实验表明，尽管模糊聚类分析结果受主观因素影响，但仍能有效对数据进行分类；而因子分析在数据量不足的情况下，仍能提取主要信息进行降维。

摘要由CSDN通过智能技术生成

Matlab 模糊C均值聚类分析与因子分析实验报告

提示：数据资源在本CSDN号的上传资料中直接领取

1 引言

数据：gyzb.mat（按顺序对应每一列）为：31个省市区的国有控股企业的主要指标（包括：总利润（亿元）、总资产贡献率（%）、资产负债率（%）、流动资产周转次数（次/年）、工业成本费用利用率（%）和人均主营收入（万元/人））。需要使用数据分析方法对该数据进行分析，试着得到一些结论。这里使用的分析方法为：模糊C均值聚类分析、因子分析。

2 算法原理

2.1 模糊C均值聚类分析的简介及算法原理：

（1）简介：

模糊C均值聚类分析（FCM，Fuzzy c-means）是从C从均值算法（Hard c-means）发展而来的。模糊聚类分析是根据研究对象本身的属性来构造模糊矩阵，并在此基础上根据隶属度来确定聚类关系，即确定样本之间的模糊关系定量。

（2）算法原理：

在这里插入图片描述

（3）算法步骤：

【1】设置好聚类类别数，设定迭代收敛条件，初始化各个聚类中心；

【2】用当前的聚类中心，计算隶属度值度函数。

【3】使用隶属度函数，重新计算计算各个聚类的中心。

【4】重复【2】、【3】的运算，直到各个样本的隶属度稳定；

【5】当算法收敛时，就得到了各类的聚类中心和各样本对于各类的隶属度值，从而完成了模糊聚类划分。

2.2 因子分析的简介及算法原理：

（1）简介：

因子分析(factor analysis)是通过研究多个变量间相关矩阵（或协方差矩阵）的内部依赖关系，找出能综合所有变量主要信息的少数几个随机变量的一种统计分析方法、预处理方法、降维技术。这几个随机变量不能直接测量，通常称为因子。各个因子间互不相关，所有变量都可以表示成公因子的线性组合。因子分析的目的就是减少变量的数目，用少量因子（若干更基本的有代表的变量）代替所有变量去分析整个问题；这些更基本的变量也叫做公共因子或共性因子。

（2）算法原理：

设有n个样本，p个指标，X = (X1, X2, X3, ……，XP)T为随机向量，要寻找的公因子为F = (F1,F2,……，Fm)T，则模型