lucene
dcb2008
这个作者很懒,什么都没留下…
展开
-
Lucene:基于Java的全文检索引擎简介
转自:http://www.chedong.com/tech/lucene.html Lucene是一个基于Java的全文索引工具包。基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking L...原创 2011-06-30 04:21:41 · 65 阅读 · 0 评论 -
lucene全文检索实施方案
为什么要使用全文索引技术? 在网站应用中,我们经常需要用到站内搜索的功能来查找指定的关键字。在网站的后台存储中,信息可能存储的地方主要有:数据库表、HTML静态页面文件、word、pdf、excel、ppt、txt等文本文件中。基于文件的全文检索当然是使用分词技术来实现。在Java开源产品中,Lucene是一个使用最广泛的全文搜索引擎,我们可以使用Lucene的API将文本的内...原创 2011-10-07 18:59:20 · 224 阅读 · 0 评论 -
[Lucene]学习总结之二:Lucene的总体架构
转自:http://simpleframework.net/blog/v/14018.html Lucene总的来说是:一个高效的,可扩展的,全文检索库。全部用Java实现,无须配置。仅支持纯文本文件的索引(Indexing)和搜索(Search)。不负责由其他格式的文件抽取纯文本文件,或从网络中抓取文件的过程。在Lucene in action中,Luce...原创 2011-10-06 15:19:19 · 88 阅读 · 0 评论 -
[Lucene]学习总结之一:全文检索的基本原理
转自:http://simpleframework.net/blog/v/13853.html 一、总论根据http://lucene.apache.org/java/docs/index.html定义:Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生...原创 2011-10-06 12:28:32 · 142 阅读 · 0 评论 -
DOC和PDF一样索引文件 - Solr 和 Tika 整合
在一些博文中已经描述过如何索引二进制文件,即为Word文件、PDF文件和 LibreOffice文档创建索引。在此,利用数据导入处理程序(Data Import Handler)实现同样的功能。不久前 Solr 服务器发布了新的版本(3.1),本文内容就基于此新版本加以描述。本文值目的是给出应用样例 - 所有变更以此样例应用为准。假设 我们假设数据是可用的XML格式,并包含文档基本信息,以...原创 2011-10-06 10:40:59 · 481 阅读 · 0 评论 -
solr读取word,pdf
转自:http://blog.csdn.net/aidayei/article/details/6535898 lucene和solr的对比:1.http://www.blogjava.net/luopeizhong/articles/321732.html2.Apache Solr:基于Lucene的可扩展集群搜索服务器 lucene对索引的更新比solr麻烦,solr只...原创 2011-10-05 17:39:44 · 378 阅读 · 0 评论 -
SolrJ的使用
英文:http://wiki.apache.org/solr/Solrj#Adding_Data_to_Solr中文:http://wiki.chenlb.com/solr/doku.php?id=solrj Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以...原创 2011-10-04 22:41:29 · 77 阅读 · 0 评论 -
利用SOLR搭建企业搜索平台
转自:http://fangxia722.blog.163.com/blog/static/31729012201056111940414/http://lianj-lee.iteye.com/category/71985 利用SOLR搭建企业搜索平台 之一(运行solr) ...原创 2011-10-04 17:37:15 · 149 阅读 · 0 评论 -
使用 Apache Solr 实现更加灵巧的搜索
转自:http://fangxia722.blog.163.com/blog/static/3172901220105611648824/ Solr 是一种可供企业使用的、基于 Lucene 的搜索服务器,它支持层面搜索、命中醒目显示和多种输出格式。在这篇分两部分的文章中,Lucene Java? 的提交人 Grant Ingersoll 将介绍 ...原创 2011-10-04 16:24:19 · 143 阅读 · 0 评论 -
全文检索服务SOLR3.3支持IK中文分词
转自:http://sinykk.iteye.com/blog/1171098 下载如下三个软件【请注意版本】1:Solr的下载地址http://labs.renren.com/apache-mirror//lucene/solr/3.3.0/apache-solr-3.3.0.zip 【使用 D:\solr\apache-solr-3.3.0\example\solr文件夹里的内容】...原创 2011-10-04 10:05:21 · 92 阅读 · 0 评论 -
使用Apache Solr对数据库建立索引(包括处理CLOB、CLOB)
使用Apache Solr对数据库建立索引(包括处理CLOB、CLOB) http://blog.csdn.net/xzknet/article/details/6710753http://blog.sina.com.cn/s/blog_56fd58ab0100u5wk.html原创 2011-10-04 08:38:40 · 99 阅读 · 0 评论 -
Solr:强大的企业级搜索引擎平台
转自:http://www.zihou.me/html/2011/04/17/3470.html Solr是Lucene下面的一个用Java写的开源子工程项目,它是一个非常强大的企业级搜索平台,它的主要特征包括强大的全文检索、高亮显示、分面搜索、动态聚类、数据库集成、富文本(比如word、PDF)及地理空间搜索等。Solr高度可扩展,提供分布式搜索及索引复制,它为许多世界上大的网站提供了强...原创 2011-10-02 19:02:44 · 192 阅读 · 0 评论 -
hibernate-search-3.3.0.Final中文文档翻译及学习笔记
转自:http://hpi-ls.blog.163.com/blog/static/2021474820101129105312604/ 开始只是自己看,没想到要翻译,从第四章开始进行翻译,主要章节基本全部进行了翻译。文档中前面是英文,后面是中文翻译,一一对应。5、Tuning Lucene indexing performance. 2ch4. 34.3. Analysis 44...原创 2011-07-01 18:34:25 · 1383 阅读 · 0 评论 -
lucene中Field.Index,Field.Store详解
转自:http://www.pusuo.net/2010-02-14/111095034.html lucene在doc.add(new Field("content",curArt.getContent(),Field.Store.NO,Field.Index.TOKENIZED));Field有两个属性可选:存储和索引。通过存储属性你可以控制是否对这个Field进行存储...原创 2011-10-18 11:13:47 · 99 阅读 · 0 评论