weka中文使用说明(三)

本文详细介绍了Weka中聚类分析的Cluster面板使用,包括Cluster Mode选项、忽略属性的选择以及K均值算法的应用。通过实例展示了如何对数据进行K-means聚类,解释了聚类结果的评价标准和簇中心的计算,以及如何可视化聚类结果。
摘要由CSDN通过智能技术生成

2.3聚类

2.3.1 Cluster面板介绍

Cluster面板如图2.3.1-1所示。


图2.3.1-1 Cluster面板

Cluster Mode 一栏用来决定依据什么来聚类以及如何评价聚类的结果。前三个选项和分类的情况是一样的:Usetraining set , Supplied test set and Percentage split——区别于现在的数据是要聚到某个类中,而不是预测为某个指定的类别。第四个模式,Classesto clusters evaluation,是要比较所得到的聚类与在数据中预先给出的类别吻合得怎样。和Classify面板一样,下方的下拉框是用来选择作为类别的属性的。

在Clustermode之外,有一个Storeclusters for visualization的勾选框,该框决定了再训练完算法后可否对数据进行可视化。对于非常大的数据集,内存可能成为瓶颈时,不勾选这一项应该会有帮助。

在对一个数据集聚类时,经常会遇到某些属性被忽略的情况。Ignoreat

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值