Lucene
张包峰
Distributed Computing
展开
-
Nulta: Lucene+Hadoop分布式并行计算搜索框架
今天在微博上看到 @陈利人 分享的关于分布式Lucene的文章,评论里也出现了一些新的基于Lucene和Hadoop的搜索框架,比如这个Nulta。因为自己的毕设是关于分布式索引的,自己也使用过Lucene,Hadoop,一直很关注也很感兴趣,就大致了解了下Nulta这个框架。根据主页里的介绍,Nulta的整个架构和思路还是不错的,我也能从它的设计中找到自己毕设的一些想法,。现在最新的源码是1原创 2012-12-16 21:01:07 · 3423 阅读 · 2 评论 -
Luke:Lucene索引查看工具
Luke介绍Luke是一个方便的索引查看和诊断工具,可以访问Lucene构建的索引文件,显示和修改某些索引内容。能提供:通过document编号或term浏览索引查看document内容,可复制到剪贴板对频率最高的term的索引字段提供排名后的浏览执行搜索语句并浏览搜索结果分析搜索结果从索引中选择性删除文件重建原始文档字段,对其进行编辑,然后重新插入的索引优化索引可以打开had原创 2013-01-12 15:13:44 · 11396 阅读 · 0 评论 -
基于Lucene的图书全文搜索引擎
基于Lucene的图书全文搜索引擎Baofeng Zhang@zju 转载请注明出处:http://blog.csdn.net/zbf8441372背景介绍 这是一个关于图书的多侧面,多粒度的搜索引擎。仿照“读秀”(http://www.duxiu.com/)那样的搜索方式和搜索结果呈现方式,可以根据书的一些基本属性进行关键字搜索,展现的时候还附加进行了搜索结果的统计原创 2012-06-04 11:42:00 · 7484 阅读 · 1 评论 -
优质博文list(分布式文件系统/存储/搜索)
转载请注明出处:http://blog.csdn.net/zbf8441372把一些好的,有用的博文搜集在这里,陆续更新,主题大都是涉及到分布式系统,文件和存储之类,还有云计算,包括一些强大的,热门的open-source,包括NoSQL生态系统,Hadoop家族,lucene全文搜索工具,一些Apache项目等等。另外一些比较好的站点和博客地址,可以拓展阅读。20. REST相关原创 2012-05-16 00:59:18 · 3783 阅读 · 3 评论 -
学术分享搜索平台——设计方案
项目背景有两类和我们大学生息息相关的产品。一类是微博,人人,豆瓣这些偏SNS的社交平台,推荐同学朋友的信息,帮助我们找到可能认识的人,可能喜欢的书,可能爱看的电影等等。另一类是学术相关的搜索引擎,比如Google Scholar,Microsoft Academic Search Engine,通过搜索关键字,提供一些匹配度最高的学术论文,提供很多便利。然而,学术搜索引擎是一个比较通用原创 2013-03-20 19:35:44 · 6156 阅读 · 8 评论 -
学术分享搜索平台——中期报告
一、 项目概况学术分享搜索引擎主要基于爬取的学术数据,提供搜索,可视化,推荐三大块功能,并且支持用户分享感兴趣的学术资源,结合“众包”来打造一个更社交化的学术搜索平台。相比于传统的学术搜索,可视化和用户的加入能让平台帮助用户发现更多的东西。我的工作是整个平台的开发和搭建。从数据上说,涵盖了数据爬取,数据处理,分布式存储,建立索引等工作;从功能上说,涵盖了网站搭建,搜索服务,可视化原创 2013-05-05 17:57:35 · 6184 阅读 · 0 评论