聚类算法
耳东鹏
这个作者很懒,什么都没留下…
展开
-
KMeans算法(K均值)
1)在说KMeans算法之前,先简单说说聚类。聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。聚类属于无监督学习。2)KMeans算法是聚类算法的一种经典算法。它的原理大致如下:第一步:随机选择K个样本作为K个聚类的中心,计算每个样本到各个聚类中心的欧氏距离,将该样本分配到与之距离最近的聚类中心所在类别中(也称为“簇...原创 2019-07-13 23:56:53 · 1646 阅读 · 0 评论 -
K-means算法改进(K-means++以及二分K-means)
上一篇文章中,我在最后有说到,K-means算法由于初始“聚类中心”点是随机选取的,因此最终求得的簇的划分与随机选取的“聚类中心”有关,也就是说,可能会造成多种 k 个簇的划分情况。这是因为K-means算法收敛到了局部最小值,而非全局最小值。为了改进这一缺点,我们可以对算法加以改进。下面,我将为大家介绍两种改进的算法——K-means++ 和二分K-means。一)K-means++...原创 2019-07-15 19:27:44 · 7524 阅读 · 0 评论