1.
对观测值进行系统聚类发现,五类药品可以分为3类。对变量进行系统聚类发现,三个变量可以分为两类。
2.
K-means聚类
变量聚类
观测值聚类
不同的聚类反映着同一聚类中的省份存在一致性,不同的聚类之间的省份具有差异性。如果分为3个聚类,可以明显发现北京市的这个聚类各项指标都比较低,说明工业生产少且污染量小,而山西省的聚类各项指标都比较高,说明工业生产量大且污染量大。
变量聚类
17个自变量分为两类,其中三个有害气体、粉尘排放量为1个聚类;其他各种工业制品产量和消费量为另一个聚类。说明水泥、煤炭等自变量之间的组内差异比较小,这些变量之间相关性较大;而例如二氧化硫和氮氧化物等有害气体的排放量之间的相关性比较大。