开放源码的搜索引擎Nutch即将发布1.0正式版

Nutch是一个完全用Java语言写成的开放源码搜索引擎。它采用Lucene作为全文检索工具,使用Hadoop作为分布式系统平台。事实上这三个项目都是由Doug Cutting创建的,而Hadoop本来只是Nutch的一部分。

Nutch的上一个版本是两年前发布的0.9版,在那之后就一直不断的有人询问什么时候会发布正式的1.0版。直到一个多月前,才有人透露Nutch 1.0会在今年2月发布。可是它还是跳了一段时间的票。现在,Nutch的开发人员正在他们的邮件列表上投票,是不是把当前的rc1版本正式发布出去。根据目前的投票情况来看,如果不再出意外(之前的rc0就遭遇了意外),很快我们就能见到正式发布的1.0版了。

如果有人迫不及待,现在可以下载这个rc1版本了。它应该跟正式版是一样的。

顺便提一下,Apache有一个基于Hadoop的机器学习平台Mahout,但目前还相当不完善。另外有个暨南大学的小伙子创建了Redpoll,同样也是基于Hadoop的开放源码的并行机器学习算法平台。

 

===3月19日更新===

Nutch 1.0的新特性之一是可以很方便的与Solr配合使用。Nutch的开发者写了如何配置的教程

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值