聚类 聚类是针对给定的样本,依据他们特征的相似度或距离,将其归并到若干个“类”或“簇”的数据分析问题。在某些场景下聚类和降维是一个意思。聚类算法只作为pipline上对特征降维使用。 相似度/计算方法 当 μ x = = μ y = = 0 \mu_x == \mu_y == 0 μx==μy==0 时二者相同 K均值 所以我们希望在初始的时候四个聚类中心互相离的远一点。 层次聚类 密度聚类法 比如通过人口密度聚类出自然城市 谱聚类 标签传递算法