搜索引擎
xiaogugood
学生
展开
-
Lucene:基于Java的全文检索引擎简介
原文地址:http://www.chedong.com/tech/lucene.htmlLucene是一个基于Java的全文索引工具包。基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking Luc转载 2013-01-16 20:07:29 · 664 阅读 · 0 评论 -
Lucene:基于Java的全文检索引擎简介
原文地址:http://www.chedong.com/tech/lucene.htmlLucene是一个基于Java的全文索引工具包。基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking Luc转载 2013-07-18 14:06:19 · 759 阅读 · 0 评论 -
Luke使用
原文地址:http://hi.baidu.com/thinke365/item/43e58fca1ee66b2bef46654b首次用Luke打开索引文件。Overview里面显示了索引具有的Field数目(以最大的Field为准吧?),还有就是文档的总数和 Term即索引词的总数? 有时一个关键词,对应于多个文档,所以文档数要多于关键字数目。还显示了索引的版本和索引的转载 2013-07-18 10:21:49 · 2444 阅读 · 1 评论 -
lucene开发必备工具luke介绍
原文地址:做lucene开发的,免不了要和索引文件打交道,但是一些二进制的文件我们怎么去看,下面就要隆重的有请luke了根据百度百科的说法:Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改。我们可以通过luke来进行一般的索引查看和修改操作。就打个比方,lucene的索引文件就好像转载 2013-07-18 10:20:15 · 2859 阅读 · 0 评论 -
Doug Cutting 访谈录 -- 关于搜索引擎的开发
原文地址:http://www.blogjava.net/dedian/archive/2006/08/02/Doug_Cutting_Interview.html作为Lucene和Nutch两大Apach Open Source Project的始创人(其实还有Lucy, Lucene4C 和Hadoop等相关子项目),Doug Cutting 一直为搜索引擎的开发人员所关注。他终于转载 2013-07-18 10:16:10 · 1152 阅读 · 0 评论 -
Nutch使用总结
原文地址:http://wenku.baidu.com/view/9447ba02cc175527072208ba.htmlNutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 Nutch使用方法简介: http://blog.csdn.net/pengpengfly/archive/2008/09/29/2994转载 2013-07-17 13:23:41 · 3673 阅读 · 0 评论 -
hadoop 在windows的Eclipse下运行出现Cannot run program "chmod": CreateProcess error=2 异常
原文地址:http://blog.csdn.net/longyi_java/article/details/8242625Windows下用Eclipse开发Hadoop程序遇到的问题及解决方法1. 运行hadoop程序报错如下:Exception in thread "main" java.io.IOException: Cannot run progra转载 2013-07-17 09:25:53 · 5168 阅读 · 1 评论 -
nutch java.io.UTFDataFormatException: Invalid byte 1 of 1-byte UTF-8 sequence
原文地址:http://liyanblog.cn/articles/2012/09/25/1348555726092.htmlMyPoint:当我们配置Nutch搜索环境时,需要将Nutch发布的文件nutch-*.*.war(这里我使用的是nutch-1.1.war)复制到Tomcat下的webapps文件下,然后我们会配置 WEB-INFclasses下的nutch-site.xm转载 2013-07-17 10:49:49 · 4321 阅读 · 0 评论 -
window环境下在myeclipse中配置nutch
原文地址:http://www.th7.cn/system/win/201302/37104.shtml由于论文需要,最近在研究nutch,网上几乎没有一篇在window环境下能够配置正确的文档.今天一天的努力,终于配置成功了!现在将资料和配置过程整理如下.1、安装Cygwin 首先,到 http://www.cygwin.com/官网上下在set转载 2013-07-16 16:06:21 · 1479 阅读 · 0 评论 -
Nutch在Windows中安装之细解
原文地址:http://blog.csdn.net/zjzcl/article/details/590537近来Nutch一词在网络中时有所见,但囿于平常工作繁忙而未能潜心细读与研究,只知道Nutch是Apache组织的一个开源项目,利用它用户可以建立自己内部网的搜索引擎,也可以建立针对整个网络的搜索引擎。好在春节假日期间,终于得空可以从容对其进行一番解读与测试了。在使用Nut转载 2013-07-15 15:35:34 · 691 阅读 · 0 评论 -
让搜索跨越语言的鸿沟——谈跨语言信息检索技术
原文地址:http://stblog.baidu-tech.com/?p=1499跨语言信息检索,是信息检索领域中的一个研究课题。近10几年来,由于互联网的飞速发展,这方面的研究受到了学术界的广泛重视。将这项技术应用于搜索,可以帮助我们查找到更多的有用信息,例如外语相关页面、多语言页面以及语言无关的资源(如图片)等等。这些信息可以大大丰富搜索的结果,满足用户多样的需求。在跨语言转载 2013-11-22 11:35:33 · 1783 阅读 · 0 评论