题目:
为了深入地了解我国人口的文化程度,利用1990年全国普查数据对全国30个省、直辖市、自治区进行聚类分析,分别选用了三个指标:(1)大学以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人口占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ)分别用来反映较高、中等、较低文化程度人口的状况。(1)计算样本的欧几里得距离,分别用最长距离法、均值法、重心法和ward法作聚类分析,并画出相应的谱系图,如果将所有样本分为4类,试写出个种方案的分类结果;(2)用动态聚类方法(共分为4类),给出相应的分类结果。
数据:
地区DXBZCZBZWMBZ
北京9.3030.558.70
天津4.6729.388.92
河北0.9624.6915.21
山西1.3829.2411.30
内蒙古1.4825.4715.39
辽宁2.6032.328.81
吉林2.1526.3110.49
黑龙江2.1428.4610.87
上海6.5331.5911.04
江苏1.4726.4317.23
浙江1.1723.7417.46
安徽0.8819.9724.43
福建1.2316.8715.63
江西0.9918.8416.22
山东0.9825.1816.87
河南0.8526.5516.15
湖北1.5723.1615.79
湖南1.1422.5712.10
广东1.3423.0410.45
广西0.7919.1410.61
海南1.2422.5313.97