构建自己的搜索引擎(lucene,hadoop,nutch)

lucene,hadoop,nutch有用过么?

如果大家积极,我可以写一个简单的说明文档,能让大家在自己的机器上构建一个类似google的搜索引擎。说明如下:

lucene:一个java的开源包,做底层的信息检索
hadoop:一个google file system的实现。可以完成如下的功能,让很多台机器的硬盘合成为一个大的硬盘,而且有冗余等功能。
nutch:一个建立在lucene,hadoop上的开源搜索引擎。可以构建自己的搜索引擎。

这个包对于刚学编程的同学来说太难了。但是对于计算机系的同学有很多好处。分布式文件系统能让你们了解底层的os对文件系统怎么处理,另外信息检索也是最近很红的一个方向。可以面google,百度。不夸张说,你把所有所有内部结构搞明白。基本出去计算机公司可以随便日了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值