Day20 聚类杂谈距离/相似度核心思想K-MeansCanopy算法 聚类衡量标准轮廓系数层次聚类密度聚类DBSCAN 谱聚类 聚类杂谈 距离/相似度 核心思想 K-Means 注:原始K-means算法最开始随机选取数据集中K个点作为聚类中心, 而K-means++按照如下的思想选取K个聚类中心: 假设已经选取了n个初始聚类中心(0<n<K),则在选取第n+1个聚类中心时:距离当前n个聚类中心越远的点会有更高的概率被选为第n+1个聚类中心。 在选取第一个聚类中心(n=1)时同样通过随机的方法。 Canopy算法 聚类衡量标准 轮廓系数 层次聚类 密度聚类 DBSCAN 谱聚类