聚类Clustering - 可视化样本聚类(Visualizing Sample Clusters)

[size=x-large]介绍:[/size]
Mahout 提供了可视化样本聚类的事例,根据以下聚类算法:
* Canopy Clustering
* Dirichlet
* Kmeans
* FuzzyKMeans
* MeanShift

[size=x-large]预先准备[/size]
为了可视化聚类,你需要执行mahout-examples模块org.apache.mahout.clustering.display包下的java程序。如果使用eclipse,将mahout-examples转换成eclipse的项目,参见Working with Maven in Eclipse.(这里假定你已经熟悉使用maven管理项目)

[size=x-large]可视化聚类[/size]
位于org.apache.mahout.clustering.display包下的class可以不带任何参数直接运行,生成样本数据,运行如下涉及的聚类:
[b]1.DisplayClustering[/b]
生成1000样本均匀分布在3个分类。这是一个相同的数据集合被使用在下面的聚类程序。在屏幕上显示大量的点,迭代出参数模型以后用来生成大量的点。你也可以编辑generateSamples() 方法来改变在这个程序中使用的样本数据
[b]2.DisplayDirichlet[/b]
使用Dirichlet程序聚类
[b]3.DisplayCanopy[/b]
使用Canopy聚类
[b]4.DisplayKMeans [/b]
使用k-Means聚类
[b]5.DisplayFuzzyKMeans[/b]
使用 Fuzzy k-Means聚类
[b]6.DisplayMeanShift[/b]
使用MeanShift聚类

如果你已经使用eclipse导入项目,选择任意一个刚刚提到的class,点击右键,选择"Run As - Java Application"

注意:
.这里的某些程序显示的样本点和当时反复迭代聚类。最终的迭代位于加粗的红色线框内,之前的数次迭代有不同的颜色(橘色,黄色,绿色,蓝色,品红)为了标识出更早的迭代使用轻灰色。这可以相像的描述出,多次迭代过程中怎样的一次次迭代
.改变参数值(k, ALPHA_0, numIterations) 和显示的SIGNIFICANCE,你将得到不同的结果

原文地址:https://cwiki.apache.org/confluence/display/MAHOUT/Visualizing+Sample+Clusters
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值