前言
前两篇介绍了利用RapidMiner利用决策树算法、贝叶斯分类器对golf数据进行简单的预测分析,当然由于数据集的有限,模型预测结果就是各种惨不忍睹,所以……今天更多是关注于K-Means算法在rapidminer中如何实践。
K-Means算法基本理解
K-Means又称K-平均数,计算标准为距离平均数。计算过程如下。
之前,非常机缘巧合看到有关K-Means算法可视化的程序。感觉对算法的理解有所帮助。可以浏览:K-means可视化 byGeorge
可能不是很方便浏览可以直接看代码,即https://github.com/silverme/KMeans/blob/master/index.html
利用RapidMiner实践K-Means
数据:Sample>data>iris
直接双击iris数据可以浏览到:数据内容及相关可视化分析