lucene
jazwoo
这个作者很懒,什么都没留下…
展开
-
Lucene2.0 快速入门
一、Lucene介绍 Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。 Lucene的作者:Luc转载 2012-07-10 20:56:17 · 801 阅读 · 0 评论 -
Lucene高亮显示详解
在Lucene的org.apache.lucene.search.highlight包中提供了关于高亮显示检索关键字的工具。使用百度、 Google搜索的时候,检索结果显示的时候,在摘要中实现与关键字相同的词条进行高亮显示,百度和Google指定红色高亮显示。有了Lucene提供的高亮显示的工具,可以很方便地实现高亮显示的功能。高亮显示,就是根据用户输入的检索关键字,检索找到该转载 2012-07-12 11:49:16 · 1408 阅读 · 0 评论 -
使用Lucene-Spatial实现集成地理位置的全文检索
Lucene通过Spatial包提供了对基于地理位置的全文检索的支持,最典型的应用场景就是:“搜索中关村附近1公里内的火锅店,并按远近排序”。使用Lucene-Spatial添加对地理位置的支持,和之前普通文本搜索主要有两点区别:1. 将坐标信息转化为笛卡尔层,建立索引Java代码 private void indexLocation(Do转载 2012-07-27 10:53:21 · 1531 阅读 · 0 评论 -
compass 使用详解
Java代码 我们在使用lucene管理document时,难免有些复杂,并且在做增量索引的时候会比较繁琐,现介绍compass如下: compass对lucene的使用就如同Hibernate和对jdbc的使用。 Compass的使用步骤: Hibernate的实现步骤是: 1》 设计实体 2》 配置映射元数据 (xml / 注解—Hibern转载 2012-07-12 12:13:25 · 1281 阅读 · 0 评论 -
lucene -- 5 得分 设置boost
通过Searcher.explain(Query query, int doc)方法可以查看某个文档的得分的具体构成。 在Lucene中score简单说是由 tf * idf * boost * lengthNorm计算得出的。 tf:是查询的词在文档中出现的次数的平方根 idf:表示反转文档频率,观察了一下所有的文档都一样,所以那就没什么用处,不会起什么决定作用。 boo转载 2012-07-10 22:36:16 · 1338 阅读 · 0 评论 -
lucene -- 4 各种Query
1. 各种Query1.1. 概述query.toString()查看原子查询1.2. 使用特定的分析器搜索IndexSearcher searcher = new IndexSearcher(path );Hits hits = null;Query query = null;QueryParser parser =new QueryParser("conten转载 2012-07-10 22:23:48 · 936 阅读 · 0 评论 -
lucene -- 3 排序、过滤、分词器
1. 排序1.1. Sort类public Sort()public Sort(String field)public Sort(String field,Boolean reverse) //默认为false,降序排序public Sort(String[] fields)public Sort(SortField field)public Sort(Sort转载 2012-07-10 22:23:05 · 731 阅读 · 0 评论 -
lucene -- 2主要的类
1. lucene中主要的类1.1. Document文档类1.1.1.常用方法方法描述void add(Field field)往Document对象中添加字段void removeField(String name)删除字段。若多个字段以同一个字段名存在,则删除首先添加的字段;若不存在转载 2012-07-10 22:22:06 · 916 阅读 · 0 评论 -
lucene -- 1概念
1. 概述Lucene是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。Lucene以其方便使用、快速实施以及灵活性受到广泛的关注。它可以方便地嵌入到各种应用中实现针对应用的全文索引、检索功能,本总结使用lucene--2.3.2。2. lucene 的包结构1、org.apache.lucene.analysis对需要建立索引的文本进行分词、过滤等操作, 语言分析转载 2012-07-10 22:21:06 · 451 阅读 · 0 评论 -
HTMLParser
HTMLParser具有小巧,快速的优点,缺点是相关文档比较少(英文的也少),很多功能需要自己摸索。对于初学者还是要费一些功夫的,而一旦上手以后,会发现HTMLParser的结构设计很巧妙,非常实用,基本你的各种需求都可以满足。 这里我根据自己这几个月来的经验,写了一点入门的东西,希望能对新学习HTMLParser的朋友们有所帮助。(不过当年高考本人语文只比及格高一分,所以文法方面的问题转载 2013-11-08 19:05:45 · 682 阅读 · 0 评论