例:
为了更深入了解我国环境的污染程度状况,现利用
2009
年数据对全国
31
个省、自治区、
直辖市进行聚类分析。
解:
现在要分析我国各个地区的环境污染程度,
案例中选择了各地区
“工业废气排放总量”
、
“工业废水排放总量”和“二氧化硫排放总量”三个指标来反映不同污染程度的环境状况,
同时选择了北京等省市的数据加以研究。
这个问题属于典型的多元分析问题,需要利用多
个指标
来分析各省市之间环境污染程度的差异。
因此,
可以考
虑利用快速聚类分析来研究
各省市之间的差异性,具体
操作步骤如下。
1)
打随书光盘中的数据文件
9-2.sav
,选择菜单栏中的【
A nalyze
(分析)
】→【
Classify
(分
类)
】→【
K-Means Cluster
(
K
均值聚类)
】命令,弹出【
K-Means Cluster Analysis
(
K
均
值聚类分析)
】对话框。
2)
在左侧的候选变量列表框中将
X1
、
X2
和
X3
变量设定为