1、K-means
参考:https://www.cnblogs.com/pinard/p/6164214.html
过程:
1、 随机在数据当中抽取k个样本,当做三个类别的中心点
2、 计算其余的点到k个中心点的距离,每一个样本有三个距离,从中选择距离最近的一个点作为自己的标记形成k个族群
3、 分别计算k个族群的平均值,把三个平均值与旧中心点进行比较
相同:结束聚类
不相同:把三个平均值当作新的中心点,重复第二步
特点:
迭代算法,直观易懂并且非常实用
缺点:容易收敛到局部最优解(多次聚类)
注意:聚类一般做在分类之前
2、DBSCAN