RapidMiner介绍与实践(三)K-Means

本文介绍了如何使用RapidMiner进行K-Means聚类分析,通过可视化和Davies Bouldin指数评估不同K值的效果。在iris数据集上实践,发现K值为2时分类效果最佳。
摘要由CSDN通过智能技术生成
前言

前两篇介绍了利用RapidMiner利用决策树算法贝叶斯分类器对golf数据进行简单的预测分析,当然由于数据集的有限,模型预测结果就是各种惨不忍睹,所以……今天更多是关注于K-Means算法在rapidminer中如何实践。

K-Means算法基本理解

K-Means又称K-平均数,计算标准为距离平均数。计算过程如下。
K-mean步骤
之前,非常机缘巧合看到有关K-Means算法可视化的程序。感觉对算法的理解有所帮助。可以浏览:K-means可视化 byGeorge
可能不是很方便浏览可以直接看代码,即https://github.com/silverme/KMeans/blob/master/index.html

利用RapidMiner实践K-Means

数据:Sample>data>iris

直接双击iris数据可以浏览到:数据内容及相关可视化分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值