一些关于文档聚类和搜索结果聚类算法的开源项目

学习元搜索自然就需要文档聚类和搜索结果聚类的算法,于是在SF 上找了找,发现了一些还活跃着的项目,都是Java 语言开发的。用关键字"clustering"搜索了一下,有120个结果,筛选了以下几个,做个记录:

Word Vector Tool

可以完成简单的文本处理,文本分类,文本聚类和信息检索

ExtMiner

一个结合了结构化查询和文档聚类技术的可扩展的框架及用户接口

Java Machine Learning API

一个关于机器学习算法的Java 库(这个跟文档聚类没有直接关系,但将来用得着)

SHReC

一个搜索结果聚类的工具

Databionic ESOM Tools

一个数据挖掘的工具,可以根据数据分类

brCluster 

实现了K-means 和分等级聚类

 

      还有一个C#写的AggClustering 实现了K-means算法。

      这儿有一片关于聚类分析的文章,比较全。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值