matlab对经济指标分析,利用kmeans分类对重庆经济进行分析(matlab)

利用kmeans分类对重庆经济进行分析

注:本文与本人在CSDN中博客一致,聊作开山。

---------

本文用matalab 中的KMEANS 函数对重庆市2014年38区县经济发展水平的评价指标进行聚类分析,并对结果进行分析。

1、指标体系

8921dfe3e91257cb44a2825243307c65.png

数据概览:

dcf16e7aa8eeea993267e66d44886c11.png

2、聚类

1) kmeans常用的调用形式

IDX = KMEANS (X, K)

[IDX,C] = KMEANS (X, K)

[IDX,C, SUMD] = KMEANS (X, K)

[IDX,C, SUMD,D] = KMEANS (X, K)

2) 参数及返回值意义

X:N*P的数据矩阵。

K:表示将X划分为几类,为整数。

IDX:N*1的向量,存储的是每个点的聚类标号。

C:K*P的矩阵,存储的是K个聚类质心位置。

SUMD:1*K的和向量,存储的是类间所有点与该类质心点距离之和。

D:N*K的矩阵,存储的是每个点与所有质心的距离。

3) 调用kmeans工具箱并进行结果分析。

i. 利用多维等高线初步确定应当将样本分为几类

contour3(A1);title(‘样本多维等高图’)

d60e97e23188012e51ddcb6ff933079d.png

通过结果我们可以发现,等高图将多维样本大致分为三个层次。

ii. 调用kmeans工具箱

A1 = zscore(A);

[IDX,C,SUMD,D] = kmeans(A1,3);

执行得到如下结果:

IDX’=

b5325d9f7e9cd9fb054a7632aefc6b99.png

聚类中心点C’=

47d0150686bf25012c278b7290199637.png

各类中样本到聚类中心点距离和

6c84524398afe0eb14296fce3082d553.png

iii. 结果分析

地区分析

ccf7f90f1a0cea944f2fb41103efc019.png

三类在地图中的直观体现。可以看到,整个重庆渝中区周围为一类(类标为3),因为经济水平相对较高;整体而言重庆西部的经济水平明显高于东部地区;值得一提的是万州区,虽然处在重庆的东部,但是由于万州的位置特殊以及发展水平比较高,使得万州的经济水平相较于其它东部地区也有明显的差别。

第一类(类标为1)为以下地区(地图中蓝色):

ddc24c488cff77bb068a5dd03f1db4b2.png

第二类(类标为2)为以下地区(地图中橙色):

97bce10d34a2243bb82676784696930c.png

第三类(类标为3)为以下地区(地图中红色):

9eea14a9ce8b3daa6d21a44b3ff7a1ee.png

指标分析:

parallelcoords(A1(a1,:),’color’,’b’);title(‘Ñù±¾Ö¸±ê•ÖÎö’);hold on

parallelcoords(A1(a2,:),’color’,’y’);hold on

parallelcoords(A1(a3,:),’color’,’r’);hold off

be155064e695d5e386ed7aa82f2c4389.png

通过指标分析,我们可以看出前面12个指标对于每一类来说具有明显差别,1类地区前面12个指标处在较低水平,2类地区前12个指标处在中等水平,3类地区前12个指标处在较高水平,这也显示2、3类地区的经济水平和消费水平处在较高水平。后面9个指标整体来说没有特别明显的差别,而且整体来说1、2类地区的经济潜力高于1类地区。这也说明目前尚出较低水平的地区将有较大的发展潜力。

有明显差别的指标(前12个指标):

a58c2f08d0a39c648104b8eb9086823c.png

无明显差别的指标(潜力指标)(后9个指标):

5ef334df4a723ab95ad5fa2c78d9e04e.png

iv. 主要代码clc

clear

data = importdata('data2.xls');

A = data.data;

B = data.textdata;

b = B(1,:);

B(1,:) = [];

A1 = zscore(A);

[IDX,C,SUMD,D] = kmeans(A1,3);

a1=find(IDX==1);

a2=find(IDX==2);

a3=find(IDX==3);

B1 = B(a1,1)';

B2 = B(a2,1)';

B3 = B(a3,1)';

fnshp_P='...\CQ.shp';

S = shaperead(fnshp_P);

c1=fit(B1,S);

c2=fit(B2,S);

c3=fit(B3,S);

mapshow(c1,'FaceColor', [0.3 0.5 1]);

mapshow(c2,'FaceColor', [1 0.5 0]);

mapshow(c3,'FaceColor', [1 0 0]);

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MATLAB模式识别实现指标分类评估预测如环境业绩等-Use_For_Predict.m 最近看到很多会员需要使用MATLAB神经网络做如下的事情: 1:MATLAB神经网络对水的质量的分类、评估、预测 (属于环境类分类、评估预测) 2:MATLAB神经网络对空气质量的分类、评估、预测 (属于环境类分类、评估预测) 2:MATLAB神经网络对土壤质量的分类、评估、预测 (属于环境类分类、评估预测) 3:MATLAB神经网络对学员的个人表现进行分类、评估、预测 (属于个人业绩鉴定) 4:MATLAB神经网络对医学、生物学上的细胞、疾病等分类、评估等(属于医学、生物学) 5:MATLAB神经网络对交通、物流等效率方面的分类、评估、预测等(属于交通、物流管理) 6:MATLAB神经网络用于故障诊断 7:概括来讲,就是使用神经网络对某些指标(如空气质量、水质量、个人业绩等)进行“有限”的分类、预测、评价等。 在这里,我特别强调“有限”两个字,因为这正是模式识别工具箱可以解决的问题。我看到很多会员使用不同的神经网络(如模糊识别,RBF, SVM等)。根据我多年的使用经验,其实基于多层BP网络的模式识别是最容易实现、效果非常满意、且结果非常具有说服力。很多会员没有掌握模式识别的精髓,或者网络训练好以后不知道如何评估、使用等。现在我用一个完整的例子来给大家展示一下它的优点。 不知道什么是模式识别,什么是BP网络的会员,请先看一下这个视频:MATLAB模式识别工具箱视频教学 用MATLAB模式识别工具箱(函数)来对某些指标(如空气质量、水质量、个人业绩等)进行分类、评估、预测,分为三步: 数据准备训练和评估预测 下面我来一步一步讲解,先谈数据的准备: 确保输入数据(包括训练以及将来要预测的数据)在比较接近的范围里(归一化是其中一种方式)。 这一个步骤不仅仅是在模式识别里,其实在任何一种网络里,这一步都是必须的。比如说你有400组数据,每组数据对应一个中国县城的空气质量。假设每组数据含有6个指标(称之为A,B,C,D,E,F,G), 如果数据A的范围是10^5-10^7, F的范围是0.1-0.5, 如果用这些数据来训练,很容易导致网络的权重也有同样的数量级的差别,结果是你的网络会非常的“敏感”(可以想象一下,如果F对应的权重是10^10,那么即使F稍微变化一下,都有可能导致网络的输出结果不同。而有时候这样的敏感度并不是你想要的,你可以对数据进行归一化处理,把数据都转换到0-1的区间内。 MATLAB模式识别工具箱可以自动对输入数据进行归一化处理,所以你只要明白这个过程,但是并不需要你额外写程序来处理这些数据。对输出数据进行二进制量化 通常情况下,用于测试的输入数据所对应的输出数据不是量化数据,比如说:优、良,或者是一级、二级等等。那么通常我们用二进制来表达,两位数字的二进制可以表示3类(01,10,11),三位数字的二进制可以表示7类(001,010,011,100,101,110,111,通常我们不使用000)。二进制的顺序不重要,比如说优可以对应001,也可以用010来表示。 经过简单处理,输入数据和新添加的二进制输入数据如下图所示: 神经网络——输入数据模式识别.png MATLAB模式识别实现指标分类、评估、预测 原始训练数据下载: training_data.xls MATLAB模式识别实现指标分类、评估、预测 把数据导入到MATLAB程序里close all clear all clc x=xlsread; y=xlsread; inputs = x'; targets = y';复制代码 我们再谈谈网络的训练和评估: 你可以使用MATLAB自带的模式识别工具箱界面来导入数据、调整参数等,然后得到结果。我通常第一次这样使用,得到一个基础架构以后,然后生成m代码,再在代码上修改。这里我演示给大家,如果通过程序来实现。下面是用来做模式识别的代码(工具箱产生的函数): % 创建一个模式识别网络(两层BP网络),同时给出中间层神经元的个数,这里使用20 hiddenLayerSize = 20; net = patternnet; % 对数据进行预处理,这里使用了归一化函数(一般不用修改) % For a list of all processing functions type: help nnprocess net.inputs{1}.processFcns = {'removeconstantrows','mapminmax'}; net.o

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值