k均值聚类算法考试例题_K-均值聚类法实例解析

本文通过2009年的数据,使用K均值聚类算法对全国31个省、自治区、直辖市的环境污染程度进行分析。选取了工业废气排放总量、工业废水排放总量和二氧化硫排放总量三个指标,旨在揭示各地区环境状况的差异。通过分析步骤,将样本分为三类,输出了聚类类别和与中心的距离。
摘要由CSDN通过智能技术生成

例:

为了更深入了解我国环境的污染程度状况,现利用

2009

年数据对全国

31

个省、自治区、

直辖市进行聚类分析。

解:

现在要分析我国各个地区的环境污染程度,

案例中选择了各地区

“工业废气排放总量”

“工业废水排放总量”和“二氧化硫排放总量”三个指标来反映不同污染程度的环境状况,

同时选择了北京等省市的数据加以研究。

这个问题属于典型的多元分析问题,需要利用多

个指标

来分析各省市之间环境污染程度的差异。

因此,

可以考

虑利用快速聚类分析来研究

各省市之间的差异性,具体

操作步骤如下。

1)

打随书光盘中的数据文件

9-2.sav

,选择菜单栏中的【

A nalyze

(分析)

】→【

Classify

(分

类)

】→【

K-Means Cluster

(

K

均值聚类)

】命令,弹出【

K-Means Cluster Analysis

(

K

值聚类分析)

】对话框。

2)

在左侧的候选变量列表框中将

X1

X2

X3

变量设定为

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值