划分聚类
woshiren123ew
这个作者很懒,什么都没留下…
展开
-
划分方法
为了达到全局最优,基于划分的聚类可能需要穷举所有可能的划分,计算量极大。实际上,大多数应用都采用流行的启发式方法,如k-means和k-中心点算法,渐进地提高聚类质量,逼近局部最优解。这些启发式聚类方法很适合发现中小规模的数据库中的球状簇。为了发现具有复杂形状的簇和对超大型数据集进行聚类,需要进一步扩展基于划分的方法。原创 2017-04-19 17:12:49 · 559 阅读 · 0 评论 -
k-均值:一种基于型心的技术
思想: k-均值算法把簇的型心定义为簇内点的均值。它的处理流 程如下。首先,在数据集D中随机地选择k个对象,每个对象代表一个簇的初始均值或中心。对剩下的每个对象,根据其与各个簇中心的欧式距离,将它们分配到最相似的簇。然后,k-均值算法迭代地改善簇内变差。对于每个簇,它使用上次迭代分配到该簇的对象,计算新的均值。然后,使用更新后的均值作为新的簇中心,重新分配所有对象。迭代继续,直到分配原创 2017-04-20 14:05:05 · 493 阅读 · 0 评论