Lucene
文章平均质量分 80
Coding Diary
从事金融风险控制相关的J2EE软件开发工作
展开
-
全文检索Lucene(一)---快速入门
全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。 对于搜索,按被搜索的资源类型,分为两种:可以分为文本类型和多媒体类型。 全文检索(Full-Text Retrieval)是指以文本作为检索对象,找出含有指定词汇的文本。全面、准确和快速是衡量全文检索系统的关键指标。 关于原创 2017-07-11 21:45:36 · 499 阅读 · 0 评论 -
全文检索Lucene(二)---索引库维护
维护索引库 1,创建索引库 2,删除索引库 3,更新索引库 4,索引库的优化索引设置的一些建议: 1) 尽量减少不必要的存储 2) 不需要检索的内容不要建立索引 3) 非文本格式需要提前转化 4)需要整体存放的内容不要分词数据与Document、Field的转换 我们在应用程序中使用对象表示数据。在数据库中使用的是表记录,所以存在来回转换的问题。同样,要索引库中使用的是Docume原创 2017-07-11 22:32:38 · 414 阅读 · 0 评论 -
全文检索Lucene(三)----查询,分词器,排序,过滤,高亮
Lucene查询: 查询出所有 关键词查询 范围查询 通配符查询 模糊查询 短语查询 布尔查询QueryParser与MultiFieldQueryParser的区别 QueryParser:只在一个字段中查询 MultiFieldQueryParser:可以在多个字段查询布尔查询: public void add(Query query, Occur occur)Occur 用原创 2017-07-12 21:12:21 · 2052 阅读 · 0 评论 -
全文检索Lucene(四)---Compass框架
Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架。 Compass之于Lucene,就像Hibernate之于JDBC,Compass就是把Lucene封装了一层。 Compass目前版本是2.2.0,已经很久没有更新与维护。Compass2.2的版本所对应的Lucene2.4.1。下载地原创 2017-07-12 21:51:41 · 1014 阅读 · 1 评论