R语言:关于我国各地区消费水平的聚类分析

本文运用系统聚类法和K-means聚类法,分析了中国31个省市的消费水平差异。研究发现,通过这两种方法均得到3类消费水平,东部沿海地区消费最高,中西部地区消费水平较低,存在一定贫富差距。聚类结果展示了消费结构的变化趋势,表明随着经济发展,居民消费结构正逐渐走向合理化。
摘要由CSDN通过智能技术生成

一、研究方法

此次研究中主要用的是系统聚类法与K-means聚类法。
系统聚类可以对变量或样品进行聚类,变量可以为连续或分离变量,提供的距离测量方法和结果表示也非常丰富。该方法的原理是先将所有n个变量或观测看成不同的n类,然后将性质最接近的两类合并为一类;再从这n-1类中找到最接近的两类加以合并,以此类推,直到所有的变量或观测被合为一类。
K-means聚类需要先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。

二、实证分析

数据来源

地区居民消费水平差异的测度方法有单一指标法和综合指标法2种方法.居民消费水平不仅仅体现在人均消费性支出等单一指标,居民生活消费的各个具体指标等也是居民消费水平的重要体现.因此,文章选择综合法分析我国城镇居民消费水平的差异,以我国31个省市为研究对象,以中国统计年鉴2005年的各地区城镇居民家庭平均每人全年消费性支出统计数据为基础,选取食品、衣着、家庭设备用品及服务、医疗保健、交通和通信、教育文化、居住娱乐服务、杂项商品和服务等8个方面的指标,构建聚类分析模型。

模型构建

数据文件的建立

导入数据并查询数据结构

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值