基于MATLAB的数值分析具体实现——题5

该博客通过MATLAB对31个省份的农村消费性支出数据进行数值分析,包括直方图、曲线图绘制,以及K均值和模糊C均值聚类,最终确定K=5,C=5。两种聚类方法得出相同分类结果,主成分分析揭示消费性支出的综合水平和消费倾向。
摘要由CSDN通过智能技术生成

题目:针对2007年我国31个省、市、自治区和直辖市的农村居民家庭平均每人全年消费性支出的8个主要变量数据,进行了多项数值分析。主要包括

  1. 绘制8个主要变量对应不同地区变化的直方图和曲线图,并进行描述分析;
  2. 同时利用K均值聚类和模糊C均值聚类方法对31个不同地区进行聚类分析并比较不同;
  3. 从协方差矩阵出发进行主成分分析,并对相应的主成分进行解释。

数据https://download.csdn.net/download/weixin_42119432/12617871
全部代码https://download.csdn.net/download/weixin_42119432/12617912

解题流程介绍

首先,读取data.xls的数据绘制了31个省份的直方图和曲线图并进行分析;其次,利用手肘法确定K均值聚类的K值并对数据31个样品进行K均值聚类;再次;利用K均值聚类的效果,采用同样分类个数的模糊C均值聚类方法对31个样品再次聚类,并得到了每个样品聚类的结果和概率;最后,根据原始数据求得其协方差矩阵并进行主成分分析,基于生活经验与查阅资料对主成分进行解释和验证。

function CodeFor5ThQuestion(data_file_address)
%data_file_address 数据文件地址 C:\Users\YW\Desktop\研一\研一下学期课件\基于MATLAB的数据
% C:\Users\YW\Desktop\data.xls

%1、获取数据
%data返回的是文件中的数据,txt输出的是文本内容,raw输出的是未处理数据
[data,txt,raw1]=xlsread(data_file_address) ;
%获取省份名字
names=txt(:,1);
names=names(3:33);
names=names';
%获取支出各项的名字
types=txt(2,2:9);

%获取行和列
[
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值