scipy.cluster是scipy下的一个做聚类的package, 共包含了两类聚类方法: 1. 矢量量化(scipy.cluster.vq):支持vector quantization 和 k-means 聚类方法 2. 层次聚类(scipy.cluster.hierarchy):支持hierarchical clustering 和 agglomerative clustering(凝聚聚类)
聚类方法实现:k-means和hierarchical clustering.
###cluster.py#导入相应的包import scipy
import scipy.cluster.hierarchy as sch
from scipy.cluster.vq import vq,kmeans,whiten
import numpy as np
import matplotlib.pylab as plt#生成待聚类的数据点,这里生成了20个点,每个点4维:points=scipy.randn(20,4)
#1. 层次聚类#生成点与点之间的距离矩阵,这里用的欧氏距离:disMat = sch.distance.pdist(points,'euclidean')
#进行层次聚类:Z=sch.linkage(disMat,method='average')
#将层级聚类结果以树状图表示出来并保存为plot_dendrogram.pngP=sch.dendrogram(Z)
plt.savefig('plot_dendrogram.png')#根据linkage matrix Z得到聚类结果:cluster= sch.fcluster(Z, t=2, criterion='inconsistent')
print "Original cluster by hierarchy clustering:\n",cluster#2. k-means聚类#将原