- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 聚类算法总结
最近要在spark上做一个聚类的项目,数据规模和类的数目都比较大。因此总结了一下常见的聚类算法。最终选择mini-batch kmeans,并使用kmeans++来初始化类中心。这样算法的执行速度比较快,而且效果相对靠谱。
2014-09-12 22:27:26 10908
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
推荐系统、计算广告、机器学习、计算机视觉;fancyspeed@weibo; fancyspeed@github
最近要在spark上做一个聚类的项目,数据规模和类的数目都比较大。因此总结了一下常见的聚类算法。最终选择mini-batch kmeans,并使用kmeans++来初始化类中心。这样算法的执行速度比较快,而且效果相对靠谱。
2014-09-12 22:27:26 10908
TA创建的收藏夹 TA关注的收藏夹
TA关注的人