![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎
文章平均质量分 81
索隆
路漫漫其修远兮,吾将上下而求索
展开
-
Lucene是一个基于Java的全文索引工具包。
Lucene是一个基于Java的全文索引工具包。基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking Lucene:简化的查询分析器,删除的实现,定制的排序,应用接口的扩展从Lucene我们还可以学到什么另外,如转载 2012-03-04 11:49:05 · 922 阅读 · 0 评论 -
Lucene04---分词器
我们知道,Lucene所做的事情主要就两件,一是创建索引,一是搜索。那么这里就有一个很重要的东西就是分词器,分词器在http://xdwangiflytek.iteye.com/blog/1389308里就提到了,这里再说说,分词器,对文本资源进行切分,将文本按规则切分成一个个进行索引的最小单位(关键词)。建立索引和进行搜索时都要用到分词器,为了保证正确的搜索到结果,在建立索引与进行搜索时使用的分转载 2012-03-15 16:11:35 · 737 阅读 · 1 评论 -
lucene学习--创建索引与搜索
首先在E:\TestLucene\workspaceSE路径下,建立文件夹indexdocs和3个txt文件:L1.txt,L2.txt,L3.txt.L1.txt内容:111111111111111111111111111111111111111111111111111111111111111111111111111信息检索就是从信息集合中找出与用户需求相关的信息。被检索的信息除原创 2012-03-15 17:37:04 · 1036 阅读 · 0 评论 -
lucene学习--查询方式
首先在E:\TestLucene\workspaceSE路径下,建立文件夹indexdocs和3个txt文件:L1.txt,L2.txt,L3.txt.L1.txt内容:111111111111111111111111111111111111111111111111111111111111111111111111111信息检索就是从信息集合中找出与用户需求相关的信息。被检索的信息除原创 2012-03-16 11:13:10 · 737 阅读 · 0 评论 -
Lucene06---查询
前面总结了很多Lucene上的东西,建立索引、高亮等等这些都是为了查询做准备和服务的,下面我们来说说查询,我们知道Lucene的主要功能就是查询功能,所以Lucene里的查询做的非常强大,可以有各种各样的查询。org.apache.lucene.search.Query包下的Query类下有需要查询对象,这里我们说其中几个比较重要的: TermQuery:关键字查询转载 2012-03-15 16:13:41 · 536 阅读 · 0 评论 -
Lucene2.9.1使用小结 (注释1)
Lucene2.9.1使用小结分类: 搜索引擎 2009-11-26 15:15413人阅读 评论(1) 收藏 举报 【++yong的博客地址:http://blog.csdn.net/qjyong 】开源全文搜索工具包Lucene2.9.1的使用。1. 搭建Lucene的开发环境:在classpath中添加lucene-core-2.9.1.jar包转载 2012-04-18 09:52:19 · 706 阅读 · 1 评论 -
compass入门例子1
在新架构中打算选择Compass或Hibernate Search作为搜索引擎框架,比较后,感觉Hibernate Search上还是没有Compass成熟,另外考虑到后期对网页的爬取及搜索需求,决定还是基于Compass来作为架构缺省的搜索引擎。网上关于Compass的文档很多,但说得相对完整其详细的入门文档基本上没有,Compass的官方文档倒是说得很详细,但是例子一塌糊涂,存在很大问题。记录转载 2012-04-18 13:45:23 · 752 阅读 · 0 评论 -
利用Compass实现一个简单的搜索引擎
Compass是一流的开放源码JAVA搜索引擎框架,对于你的应用修饰,搜索引擎语义更具有能力。依靠顶级的Lucene搜索引擎,Compass 结合了,像 Hibernate和 Sprin的流行的框架,为你的应用提供了从数据模型和数据源同步改变的搜索力.并且添加了2方面的特征,事物管理和快速更新优化. Compass的目标是:把java应用简单集成到搜索引擎中.编码更少,查找数据更便捷。转载 2012-04-18 13:47:28 · 828 阅读 · 0 评论 -
Lucene 开发手册
1.1 前言l 编制本手册的目的:1.描述Lucene用途,使开发人员依据本手册初步认识Lucene;2.描述Lucene的API,使开发人员可以快速认识并利用Lucene开发搜索引擎;3.描述Lucene和webdt的融合;4. 重点描述Lucene的应用,使开发人员可按照本手册的描述开发。l 本手册面向的读者:熟悉Java开发,并对WEBDT软件的特点(请参阅转载 2012-04-20 10:46:22 · 2792 阅读 · 1 评论 -
Lucene3.0分词系统
Lucene3.0分词原理与分词系统分词原理 建立索引和查询的过程中,都是以基本的语素项为单位的。基本的语素项就是通过分词得到。这个过程决定了索引单元金额最终的匹配过程。 分词在文本索引的建立过程和用户提交检索过程中都存在。利用相同的分词器,把短语或者句子切分成相同的结果,才能保证检索过程顺利进行。 1、 英文分词的原理 基本的处理流程是:输入文本、词汇分割、词汇过滤(去除停留转载 2012-04-20 10:45:10 · 1414 阅读 · 0 评论 -
Lucene05---Highlighter
前面讲了分词器,但是我们在搜索的时候是不是还有一个效果就是高亮和一段文本。那么这里我们就来介绍一下Highlighter。 Highlighter: 可以截取一段文本,并且让关键字高亮显示(通过指定前缀和后缀实现,因为是在网页中显示,指定就会在网页中显示为红色)。 FirstLucene03ByHighlighter.java:Java代码转载 2012-03-15 16:12:45 · 763 阅读 · 1 评论 -
Lucene03---索引位置的优化(内存和磁盘配合使用)
在前面的http://xdwangiflytek.iteye.com/blog/1391510 文章里我们使用Lucene3.5做了一个Demo,在Demo中我们实现了一个创建索引和搜索的功能。那么我们现在在回过头来看看在上面的Demo中,我们是将索引的位置放在本地磁盘中的,在上面最开始我也说了索引的位置可以是本地磁盘也可以是内存中,那么我们可以想想,如果索引放在内存中会怎么样?简单点来想,肯定是转载 2012-03-15 16:10:45 · 2001 阅读 · 2 评论 -
全文搜索---Solr(它与lucene的关系)
说起Apache Lucene,可以说无人不知,无人不晓,但是说道Apache Solr,恐怕知道的不多。看看Apache Solr的说明:Solr是一个基于Lucene java库的企业级搜索服务器,包含XML/HTTP,JSON API, 高亮查询结果,faceted search(不知道该如何翻译,片段式搜索),缓存,复制还有一个WEB管理界面。Solr运行在Servlet容器中转载 2012-03-07 23:17:58 · 3161 阅读 · 0 评论 -
Lucene 介绍
Lucene是一套用于全文检索和搜寻的开放源码程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻,在Java开发环境里Lucene是一个成熟的免费开放源代码工具;就其本身而论,Lucene是现在并且是这几年,最受欢迎的免费java资讯检索程式库。[编辑]历史Lucene最初是由Doug Cutting所撰写的,他是一位资深的转载 2012-03-08 09:36:01 · 716 阅读 · 1 评论 -
Lucene 3.5 测试代码
今天看Oracle的全文索引功能,突发奇想想自己写个搜索程序,在网上下到Lucene后首先当然是测试代码了,没想到网上的教程都很旧了,最新3.5版中有不少接口都废弃了,在网上找到的3.5的代码又都比较复杂,于是干脆看了几个小时文档,自己写出来一个逻辑简单的测试代码。 本人环境:winduws 7 sp1 64 bit,java 6u30 64 bit,eclipse 3.7.1 64 bi转载 2012-03-12 16:02:52 · 622 阅读 · 1 评论 -
Lucene 的学习
通过这几天的看书和学习,对 Lucene 有了更进一步的认识,所以总结一下这些天的学习成果把 Lucene 的学习心得也学出来。1 Lucene 的认识 提到 Lucene 很多人都知道这个开源的搜索工具,其魅力也是很大的。它让我们对搜索引擎的认识不在那么神秘,也不会在觉得百度和 google 的技术多么的高深没测,其实其原理都是一样的,只是他们要做的更好,走的更远罢了。转载 2012-03-12 17:53:52 · 593 阅读 · 0 评论 -
用lucene3.5搜索数据库和txt文件内容
我们以前经常碰到搜索数据库的内容;用like %的sql语句;如果数据量大而且多表查询时;速度实在让人难以忍受。。。如果用lucene3.5那就可以把这个恼人的问题解决了。 lucene3.5搜索photo表的title,username,tagname,desr内容;用一个例题来说明更直观;此例题能搜索中文分词;(需要mysql5的jdbc包和lucene3.5的包):转载 2012-03-12 16:25:29 · 670 阅读 · 1 评论 -
lucene练习
package lucene.mine;import java.io.File;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;原创 2012-03-13 18:02:02 · 651 阅读 · 1 评论 -
Lucene01---几个概念理解
在http://xdwangiflytek.iteye.com/blog/1386439里我简单的介绍了一下SEO,下面来学习一下Lucene技术,这部分先来理解几个概念。信息检索概念: 信息检索就是从信息集合中找出与用户需求相关的信息。被检索的信息除了文本外,还有图像、音频、视频等多媒体信息,这里我们主要来说说文本信息的检索。 信息检索的分类: 全文检转载 2012-03-14 14:11:04 · 678 阅读 · 1 评论 -
Lucene02---Lucene入门与Demo
Lucene介绍: Lucene是一个高性能,可伸缩的全文检索工具包,可以使用他为你的应用程序添加索引和搜索能力。(注:它不是一个完整的搜索应用程序),Lucene目前是我们熟知的Apache里的一个开发项目,也是目前最为流行的基于Java开源全文检索工具包。 官网:http://lucene.apache.org/,从官网上看可以发现其版本不止Java的还有.NE转载 2012-03-14 14:34:34 · 706 阅读 · 0 评论 -
lucene学习--分词和高亮显示
首先在E:\TestLucene\workspaceSE路径下,建立文件夹indexdocs和3个txt文件:L1.txt,L2.txt,L3.txt.L1.txt内容:111111111111111111111111111111111111111111111111111111111111111111111111111信息检索就是从信息集合中找出与用户需求相关的信息。被检索的信息除原创 2012-03-15 17:41:58 · 1951 阅读 · 0 评论 -
Lucene搜索方法总结
Lucene搜索方法总结 更多lucene信息欢迎查看http://summerbell.iteye.com/category/918591.多字段搜索使用 multifieldqueryparser 可以指定多个搜索字段。query query = multifieldqueryparser.parse(”name*”, new string[] { fieldname, f转载 2012-04-23 14:19:23 · 826 阅读 · 1 评论