![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
mahout聚类算法
文章平均质量分 73
Little_Butterfly
这个作者很懒,什么都没留下…
展开
-
mahout k-means
Kmeans算法是应用的最广泛的基于划分的算法,实验室有个小伙伴最后的毕业论文也是基于kmeans聚类进行研究的(咦。。。好像前言不搭后语)。 kmeans算法的大致思想是:首先随机选取K个数据对象,每个数据对象分别代表了K个簇的中心点,对于剩下的每个对象,分别计算该对象到各个中心点的距离,并将他们分配给最近的簇,然后重新计算各个簇的中心。重复这个过程,直至聚类准则函数收敛。准则函原创 2017-03-09 18:45:09 · 364 阅读 · 0 评论 -
mahout中的聚类算法(Canopy的主场)
聚类算法的定义:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。(From:百度百科)现实生活中有很多聚类的例子,比如对疾病的分类,或者所谓的物以类聚,人以群分都是聚类的直接体现。 聚类算法在mahout中分为很多种,例如canopy,kmeans,层次聚类等。传统的聚类算法对原创 2017-03-09 16:27:11 · 633 阅读 · 0 评论