lucene学习笔记
一条梦想会飞的鱼
努力做一个充实的人
展开
-
lucene 4.3 索引的简单创建和搜索代码展示
在写代码之前,首先要构建好开发的环境,添加项目所需要的jar包,lucene索引的创建和搜索需要的jar包主要如下:lucene-core-4.3.0.jarlucene-analyzers-common-4.3.0.jarlucene-queryparser-4.3.0.jar创建索引的主要代码如下: /** * 创建索引原创 2013-07-01 15:14:16 · 1182 阅读 · 0 评论 -
lucene 4.3 通过TokenStream显示分词代码演示
核心代码:public class AnalyzerUtils { public static void displayToken(String str,Analyzer a) { try { TokenStream stream = a.tokenStream("content",new StringReader(str));原创 2013-07-02 16:42:00 · 1301 阅读 · 0 评论 -
lucene 4.3 中文分词代码演示
首页导入开发需要的架包: 这里采用的中文分词器是mmseg4j: mmseg4j用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。 MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex加了四个原创 2013-07-03 10:10:32 · 1480 阅读 · 1 评论 -
lucene 4.3 自定义中文分词器代码演示
首先导入开发需要的架包: 这些架包都能在网上下载 代码演示: 首先创建一个类,继承Analyzer,实现自己的分词器,实现具体方法,代码如下:package com.szy.arvin.demo;import java.io.Reader;import org.apache.lucene.analysis.Analyzer原创 2013-07-03 16:03:45 · 1796 阅读 · 0 评论