基于Spark的K-means快速聚类算法的优化
摘要1 引言2 相关研究2.1 Spark计算框架2.2 K-means算法2.3 K-means++算法3 SMGK-means算法及在Spark上的并行化实现3.1 改进K-means算法措施(一共三种)3.2 肘部法则确定K值3.3 算法改进步骤3.4 基于Spark的SMGK-means算法的并行实现3.5 每个K值下SMGK-means算法时间复杂度分析4 实验及结果分析1)算法运行时间比较。2)准确率对比。3)加速比的对比。
复制链接