相关的lucene包请到:
http://code.google.com/p/paoding/downloads/list 下载。
入门第一篇: Lucene整合"庖丁解牛"中文分词 ----入门 1
相关的 Lucene 中文引擎,庖丁解牛的辞典参数配置方法请看 入门第一篇。
目录结构图:
E:/ECLIPSE/LUCENETEST
│ .classpath
│ .mymetadata
│ .project
│
├─.myeclipse
├─src
│ │ paoding-dic-home.properties
│ │
│ └─cn
│ └─luanmad
│ └─lucene
│ Test.java
│
└─WebRoot
│ index.jsp
│
├─META-INF
│ MANIFEST.MF
│
└─WEB-INF
│ web.xml
│
├─classes
│ │ paoding-dic-home.properties
│ │
│ └─cn
│ └─luanmad
│ └─lucene
│ Test$1.class
│ Test.class
│
└─lib
commons-logging.jar
junit.jar
lucene-analyzers-2.2.0.jar
lucene-core-2.2.0.jar
lucene-highlighter-2.2.0.jar
paoding-analysis.jar
Test.java
index.jsp
本实例是采用了二元分词来搜索的,二元分词对于单个字是搜索不到的,除非辞典里有。如果想体验一元搜索,只需要把Test.java 中
//二元分词
//Analyzer analyzer = new PaodingAnalyzer();
//一元分词
Analyzer analyzer = new StandardAnalyzer();
切换就行。
入门第一篇: Lucene整合"庖丁解牛"中文分词 ----入门 1
相关的 Lucene 中文引擎,庖丁解牛的辞典参数配置方法请看 入门第一篇。
目录结构图:
E:/ECLIPSE/LUCENETEST
│ .classpath
│ .mymetadata
│ .project
│
├─.myeclipse
├─src
│ │ paoding-dic-home.properties
│ │
│ └─cn
│ └─luanmad
│ └─lucene
│ Test.java
│
└─WebRoot
│ index.jsp
│
├─META-INF
│ MANIFEST.MF
│
└─WEB-INF
│ web.xml
│
├─classes
│ │ paoding-dic-home.properties
│ │
│ └─cn
│ └─luanmad
│ └─lucene
│ Test$1.class
│ Test.class
│
└─lib
commons-logging.jar
junit.jar
lucene-analyzers-2.2.0.jar
lucene-core-2.2.0.jar
lucene-highlighter-2.2.0.jar
paoding-analysis.jar
Test.java
代码:
代码:
//二元分词
//Analyzer analyzer = new PaodingAnalyzer();
//一元分词
Analyzer analyzer = new StandardAnalyzer();
切换就行。
附件
-
luanmad!Search.jpg
(168.19 KB)
-
2009-07-24 17:26,下载次数: 0
-
下载
google一下 luanmad 乱码D
或直接到
LuceneTest。rar