聚类算法分类
划分聚类 Partitioning Methods :K-means
层次聚类 Hierachical Methods: Bottum-Up,Top-Down, BIRCH, CURE, CHAMELEON
基于密度的聚类 Density-based Methods: DBSCAN
基于网格的聚类 Grid-based Methods:CLIQUE
基于模型算法 Model-based Methods:统计方案,神经网络方案
kmeans
算法思想
初始随机给定K个簇中心,按照距离最近 原则把待分类的样本点分到各个簇,然后按平均法重新 计算各个簇的质心,从而确定新的簇心,迭代计算,直 到簇心的移动距离小于某个给定的误差值。使用算法描述语言
步骤
1.任意选择K个点作为初始聚类中心;
2. 计算每个样本点到聚类中心的距离,将每个样本点划分到离 该点最近的聚类中去;
3. 计算每个聚类中所有点的坐标平均值,并将这个平均值作为 新的聚类中心。
反复执行2、3,直到聚类中心的移动小于某误差值或者聚类次数 达到要求为止。
计算距离的方法通常是欧几里得距离
Dist=(x1−x2)2+(y1−