学习笔记——Canopy + K-means的聚类算法
聚类和分类聚类聚类算法是将一系列文档聚团成多个子集或簇,聚类的结果是要求簇内的文档之间要尽可能相似,而簇间的文档要尽可能不相似。聚类是无监督学习的一种最普遍的形式,无监督意味着不存在对文档进行类别标注。分类分类是监督学习的一种形式,其目标是对人类赋予数据的类别差异进行学习或复制。而在以聚类为代表的无监督学习中,并没有这样的人来对类别的差异进行引导。K-means算法K-均值算法是最...
原创
2019-07-12 18:37:45 ·
10782 阅读 ·
9 评论