在之前,我们已经学过了四大类聚类分析及其典型算法。本文,我们将使用划分方法中的k-均值算法和层次聚类方法以一个实例进行完整的聚类分析演示。
1. 问题描述
例题: 为研究我国31个省、市、自治区2007年的城镇居民生活消费的规律,根据调查资料作区域消费类型划分。原始数据表1所示:
![表1:原始数据表](https://img-blog.csdnimg.cn/20200426155312666.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4OTA0NjU5,size_16,color_FFFFFF,t_70)
问题:
- 针对上述问题,采用k-means对其进行聚类(讨论k取何值才是最优);
- 采用层次聚类(讨论采用欧式距离,分别用最短距离法、最长距离法、类平均法、中间距离法、重心法和ward法得出的聚类图,哪个是最优的)。
实验结果
请阅读我的推文
程序参考
源程序及数据已经上传Github