搜索引擎
love__coder
新博客:http://info.51rtb.cn
新浪微博:http://weibo.com/lovecoder
展开
-
搜索引擎技术网站
Lucene: IBM入门教程: http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/ Lucene中国网站: http://www.lucene.com.cn/原创 2010-08-02 20:25:00 · 1015 阅读 · 0 评论 -
Lucene .net 下载
目前,lucene.net最新版本是2.9.2地址:https://svn.apache.org/repos/asf/lucene/lucene.net/tags/Lucene.Net_2_9_2/呵呵,当我看到那么多文件夹,目录,也不是rar格式的,我当时都蒙了,这可怎么下载啊,幸亏,我在域名中看到了svn,而恰巧,我最近抛弃了vss,改用svn,我抱着试试的心理,点右键,选择svnche ckout,输入地址https://svn.apache.org/repos/asf/lucene/lucene.n原创 2010-08-02 21:02:00 · 2221 阅读 · 1 评论 -
lucene学习教程
1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 2 lucene的工作方式 lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除;所谓出是读出,即向用户提供全文搜索服务,让用户可以通过关键词定位源。 2.1写入流程 源字符串首先经过analyzer处理,包括:分转载 2010-08-02 20:10:00 · 989 阅读 · 0 评论 -
lucene的几个重要概念
<br /> lucene用到一些概念,了解它们的含义,有利于下面的讲解。 <br /><br /> 3.1 analyzer <br /> Analyzer是分析器,它的作用是把一个字符串按某种规则划分成一个个词语,并去除其中的无效词语,这里说的无效词语是指英文中的“of”、 “the”,中文中的“的”、“地”等词语,这些词语在文章中大量出现,但是本身不包含什么关键信息,去掉有利于缩小索引文件、提高效率、提高命中率。 <br /> 分词的规则千变万化,但目的只有一转载 2010-08-02 20:16:00 · 892 阅读 · 0 评论