lucene
文章平均质量分 85
iteye_4062
这个作者很懒,什么都没留下…
展开
-
lucene跨度域查询(一)
一、跨度域查询 基类是:SpanQuery 子类:SpantermQuery; //测试用的这个子类当然还有其他 二、测试public class SpanTest { Directory dir; IndexWriter writer; IndexReader reader; IndexSearcher searc...原创 2013-05-04 23:25:15 · 154 阅读 · 0 评论 -
Lucene的基本分词过程
一、Analyzer Analyzer类是所有分词器的基类,它是个抽象类,所有的子类必须实现@Overrideprotected TokenStreamComponents createComponents(String fieldName, Reader reader) { return new TokenStreamComponents; }...原创 2013-04-09 20:08:42 · 101 阅读 · 0 评论 -
Lucene的简单查询
一、特定查询 基本是对一个域进行匹配单一的匹配查询 Term term=new Term("name","小小"); TermQuery query=new TermQuery(term); TopDocs hits=searcher.search(query,10); 二、Que...原创 2013-04-05 20:37:45 · 68 阅读 · 0 评论 -
初识lucene-增删改查(三)
一、lucene的索引的创建 package com.stx.testlucene;import java.io.File;import java.io.IOException;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.cn.smart.Sm...原创 2013-03-23 20:23:28 · 65 阅读 · 0 评论 -
初识lucene(二)
一、field说明 对于一个文档来说有多个域,域也是对应的搜索模块。二、field的 1.一些子类首先是一个不变的属性值,这类字段还有一个主要用途,就是可以用于对搜索的返回结果集排序或是按范围查询FloatFieldDoubleField IntFieldLongFieldBinaryDocValuesField ...原创 2013-03-22 23:16:21 · 78 阅读 · 0 评论 -
初识lucene(一)
一、乱碰 去年5、6月份看了下lucene+hibernate简单碰了下,后来又想看但是就丢了。现在打算重新学下,东西感觉挺多的。不知道能不能坚持下。打算做个简单的小搜索。二、lucene的简单用法 1.创建索引用到的核心类 Directory //描述索引存放的位置Analyzer ...原创 2013-03-21 01:09:46 · 70 阅读 · 0 评论 -
CharTokenizer的简单学习
一、关系AttributeSource→TokenStream→Tokenizer ↓ TokenFilter=============================================Analyzer中的一个抽象方法是/...原创 2013-07-20 21:29:24 · 396 阅读 · 0 评论 -
Lucene之AttributeImpl源码简单
一、简单介绍 Attribute接口是一个空接口;AttributeImpl也继承Attribute接口; 根据源码是:记录对象的属性,但是不包含静态属性 对于一些属性是Attribute是接口,然后AttributeImpl去实现接口。 ...原创 2013-07-07 22:45:31 · 174 阅读 · 0 评论 -
AttributeSource内容简答分析
一、AttributeImpl通过AttributeSource得到自己的属性和对应的值//静态的final方法得到一个WeakIdentityMap<k,v> k=impl v=list<attribute>private static final WeakIdentityMap<Class<? extends AttributeImpl>,...原创 2013-07-06 22:12:25 · 274 阅读 · 0 评论 -
lucene设置高亮
一、文档中的代码修改下Filter: Directory dir=FSDirectory.open(new File("E:\\lucene\\test_lucene\\index")); IndexReader r=DirectoryReader.open(dir); //IndexSearcher search=new IndexSearcher(r); In...原创 2013-06-10 16:42:52 · 139 阅读 · 0 评论 -
内容解析工具:TIKA
一、TIKA是什么 它是这样的一个工具集:使用已有的各种解析库(parser libraries),从各种类型的文档中,探测、抽取其中的头数据(metadata)和结构化文本内容。 二、TIKA的作用 1.能识别文档类型、编码、语言、其他属性 2.抽取文档内容 三、获取TIKA 1.得到TIKA...原创 2013-06-10 15:55:49 · 278 阅读 · 0 评论 -
Lucene 扩展QueryParse
一、QueryParser的功能扩展点 //通配符查询 protected Query getWildcardQuery(String field,String termStr) throws ParseException{ throw new ParseException("Wildcard not allowed"); }//模糊查询pro...原创 2013-05-13 22:57:56 · 122 阅读 · 0 评论 -
Lucene匹配所有的信息Collector
一、继承Collector接口实现这样的一个自定义类public class TestCollectors extends Collector{ private Scorer socore; //这个是否为有序排列的 ture可以接受无序排列 @Override public boolean acceptsDocsOutOfOrder() { return tru...原创 2013-05-13 21:30:17 · 123 阅读 · 0 评论 -
Lucene的简单查询(二)
一、查询 1.查询的基本方法 search.search(query, results) search.search(query, n) search.search(query, filter, results) search.search(query, filter, n) search.search(query, n,...原创 2013-04-11 21:14:48 · 80 阅读 · 0 评论