Lucene
楠317
Q398731326
展开
-
Lucene_demo09_txt文件索引
Java代码 /** * txt文件索引 */ public class IndexFile { private Directory directory; private String indexPath = "D://lucene/index"; // 建立索引文件的目录 private Str转载 2015-10-16 09:09:11 · 333 阅读 · 0 评论 -
Lucene_demo08_Hightlighter高亮
Java代码 /* * 1、使关键字变色 总冠军 * 2、控制摘要的大小 */ public class HightlighterTest { @Test public void testSearchIndex() throws Exception { IndexSearcher indexSearcher转载 2015-10-16 09:08:45 · 368 阅读 · 0 评论 -
Lucene_demo03_索引库整理
将索引文件夹库中的相同的索引文件_a.cfs、_b.cfs、...重复的合并到一个文件中_b.cfs Java代码 /** * 索引库整理 * @version 2013-6-8 */ public class OptimizeTest { @Test public void optimize() thr转载 2015-10-16 09:06:26 · 223 阅读 · 0 评论 -
Lucene_demo02_分词
Java代码 /** * 英文的分词器 中文的分词器 */ public class AnalyzerTest { /** * 英文分词:(Lucene自带包) * @throws Exception */ @Test public void testEN() throw转载 2015-10-16 09:05:52 · 275 阅读 · 0 评论 -
Lucene_demo01_FirstProject
Java代码 /** * 创建一个索引库,把一个信息加入到索引库中、把信息从索引库中检索出来 */ public class HelloLuceneWorld { /** * 创建索引 */ @Test public void createIndex() throws Exception {转载 2015-10-16 09:04:44 · 216 阅读 · 0 评论 -
Lucene过滤器的简单实现
[java] view plaincopypackage org.sam.demo.lucene; import java.io.IOException; import java.util.BitSet; import org.apache.lucene.index.IndexReader; import org.apache转载 2015-10-16 09:12:28 · 424 阅读 · 0 评论 -
Lucene3.6 之 Filter
1、TermRangeFilterA Filter that restricts search results to a range of term values in a given field. This filter matches the documents looking for terms that fall into the supplied range accord转载 2015-10-16 09:11:34 · 442 阅读 · 0 评论 -
基于 Lucene 的8 个开源搜索引擎
摘要: Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大...Apache SolrSolr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到 ... Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以转载 2015-10-16 09:10:50 · 3284 阅读 · 1 评论 -
什么是垂直搜索引擎
垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为转载 2015-10-16 09:10:23 · 14573 阅读 · 0 评论 -
Lucene_demo07_Sort匹配度
Java代码 /** * @see 1、相同的结构,相同的关键词,得分一样 * @see 2、相同的结构,不同的关键词,得分不一样,一般情况下,中文高于英文 * @see 3、不同的结构,相同的关键词,关键词的得分越高,排名越靠前.关键词出现的频率越高,得分越高 * @see 4、lucene的竞价排名 */ public class Sort转载 2015-10-16 09:08:21 · 390 阅读 · 0 评论 -
Lucene简介
IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加入索引,同时控制索引过程中的一些参数使用。 Analyzer:分析器,主要用于分析搜索引擎遇到的各种文本。常用的有StandardAnalyzer分析器,StopAnalyzer分析器,WhitespaceAnalyzer分析器等。 Directory:索引存放的位置;lucene提供了两种索引存放的位置,一种是磁转载 2015-10-16 09:07:56 · 428 阅读 · 0 评论 -
Lucene_demo05_内存索引和文件索引
内存索引库:数据是临时的、访问速度比文件索引库要快、索引库中的数据不能存放太多、内存索引库和文件索引库能结合在一起 两个或者两个以上的索引库的合并: 如果是内存索引库,直接调用构造函数进行合并就可以了 内存索引库中。也可以调用addIndexesNoOptimize进行合并 如果是文件索引库,调用addIndexesNoOptimize进行合并,该方法可以接受多个索引库转载 2015-10-16 09:07:22 · 282 阅读 · 0 评论 -
Lucene_demo04_分页
Java代码 /** * 分页 */ public class DispageTest { // 分页类 private void testSearchIndex(int firstResult, int maxResult) throws Exception { IndexSearcher indexS转载 2015-10-16 09:06:50 · 224 阅读 · 0 评论 -
Lucene_demo00_IndexCURD
索引库创建、查询 、修改 、删除 Java代码 /** * @see 创建索引库,把article对象加入到索引库中 * @see 查询 、修改 、删除 */ public class ArticleIndexCUDR { /** * 创建索引库 * @throws Exception */转载 2015-10-16 09:05:24 · 230 阅读 · 0 评论 -
搜索引擎的工作原理
一、搜索引擎基本工作原理 了解搜索引擎的工作原理对我们日常搜索应用和网站提交推广都会有很大帮助。 ........................................................................................ ■ 全文搜索引擎 在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的转载 2015-10-16 09:09:51 · 638 阅读 · 0 评论 -
Lucene_demo06_几种搜索
创建searcher的过程 1、创建Directory 2、根据directory创建indexReader 3、根据indexReader创建indexSearcher 4、创建搜索的Query 5、根据searcher搜索并且返回TopDocs 6、根据TopDocs获取ScordDoc对象获取具体的Document对象 7、根据searcher和ScordDoc对转载 2015-10-16 09:11:12 · 65 阅读 · 0 评论