K-means聚类
k-mean聚类是将输入数据划分为k类的算法。首先需要初始化k个类中心,再判断其他数据分别离类中心的距离,根据距离来判断它是属于哪一类
class1=1.5*randn(100,2)
#print(class1.shape)
class2=randn(100,2)+array([5,5])
features=vstack((class1,class2))
features=whiten(features)
#用k=2对两类二维数据进行聚类
centroids,variance=kmeans(features,2)#初始化聚类中心(centroids)
cluster,distance=vq(features,centroids)#cluster:分簇